正交试验方差分析
实验设计的方差分析与正交试验

实验设计的方差分析与正交试验一、实验设计中的方差分析方差分析(analysis of variance,ANOVA)是一种统计方法,用于比较不同组之间的均值差异是否具有统计学上的显著性。
在实验设计中,方差分析主要被用来分析因变量(dependent variable)在不同水平的自变量(independent variable)中的变化情况。
通过比较不同组之间的方差,判断是否存在显著差异,并进一步分析差异的原因。
1. 单因素方差分析单因素方差分析是最简单的方差分析方法,适用于只有一个自变量的实验设计。
该方法通过比较不同组之间的方差来判断各组均值是否有差异。
步骤如下:(1)确定研究目的,选择合适的因变量和自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差和组间方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
2. 多因素方差分析多因素方差分析是在单因素方差分析的基础上,增加了一个或多个自变量的情况下进行的。
这种方法可以用来分析多个因素对因变量的影响,并判断各因素的主效应和交互效应。
步骤如下:(1)确定研究目的,选择合适的因变量和多个自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差、组间方差和交互方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
二、正交试验设计正交试验设计是一种设计高效实验的方法,可以同时考虑多个因素和各个因素之间的交互作用,并通过较少的试验次数得到较准确的结果。
1. 正交表的基本原理正交表的设计是基于正交原理,即每个因素和其他所有因素的交互效应都是独立的。
通过正交表设计实验,可以确保各因素和交互作用在样本中能够均匀地出现,从而减少误差来源,提高实验结果的可靠性。
2. 正交试验设计的步骤(1)确定要研究的因素和水平。
第4讲5(1) 正交试验设计(方差分析)

处理号 1 2
第1列(A) 1 1
表 L9(34)正交表
第2列 1 2
第3列 1 2
第4列 1 2
因素A第1 试验结果y水i 平3次
重复测定 y1 值 y2
3
1
3
3
3
y3
单4 因素 2
1
2
3
y4
试5 验数 2
2
3
1
y5
因素A第2
SS据A6=资13(料y1 y22
格式 78=13(K12
3 K322
y3)2 (y43y5
K32)-
T2 9
1 2
y6)2 ( 1 y7 3 1
y 82y 9)2 2 3
(y1yy62 ...
9
y7 y8
y水9)平2(修 3次正重项) 复测定值
9
3
3
2
1
y9
分析第1列因素时,其它列暂不考虑,将其看做条件因因素素A。第3
因素 重复1 重复2 重复3
显著影响
(6)列方差分析表
(1)偏差平方和分解:
总偏差平方和=各列因素偏差平方和+误差偏差平方和
SST SS因素 SS空列(误差)
(2)自由度分解:
dfT df因素 df空列( 误列(
(3)方差:MS因素=
SS因素 df因素
,MS误差=
SS误差 df误差
(4)构造F统计量:
F因素=
MS因素 MS误差
(5)列方差分析表,作F检验
若计算出的F值F0>Fa,则拒绝原假设,认为 该因素或交互作用对试验结果有显著影响;若 F0≼Fa,则认为该因素或交互作用对试验结果 无显著影响。
正交试验方差分析

1(50) 1(6.5) 1(2.0) 1 1 2 2 2(7.0) 2(2.4) 3(7.5) 3(2.8 2 3 1 3 2 3
2(55) 1
3(58) 1
8பைடு நூலகம்
9 K1j
3
3 15.76
2
3 25.18
1
2 22.65
3
1 20.74
10.9
8.95
T 65.58
K2j
K3j K1j2 K2j2 K3j2
n
对上式做如下变换
SST ( X ij X ) 2 ( X ij X i. X i. X ) 2
i 1 j 1 i 1 j 1
r
n
r
n
( X ij X i. ) ( X i. X ) 2 (X ij X i. )( X i. X )
各式的物理意义
X
所有数据的平均值称为总平均 值 第i个水平的数据平均值称为组平均值 随机误差,又称为组内离差平方和
X i.
SSE 表示每一个数据与其组平均值的离差平方和,反映了实验中的
SS A
表示组平均值与总的平均值得离差平方和,反映了由于因素不同水平引 起的差异又称为组间离差平方和
再稍做整理
X 总和 2 2 SST ( X ij X ) ( X ij ) N i 1 j 1 i 1 j 1 X 总和 校正项CF N
2 2 i 1 j 1 r n i 1 j 1 r n i 1 j 1
r
n
r
n
r
n
( X ij X i. ) ( X i. X ) 2
2 i 1 j 1 i 1 j 1
高级篇 第二章 正交试验设计及统计分析-方差分析

0.415
(2)显著性检验
根据以上计算,进行显著性检验,列出方差分析表,结果见表10-24
变异来源
A B C△ 误差e 误差e△ 总和
平方和 45.40 6.49 0.31 0.83 1.14 53.03
自由度 2 2 2 2 4
表10-24 方差分析表
均方 F值
Fa
22.70 79.6 F0.05(2,4) =6.94
油温℃A 1 1 2 2 3 3 4 4
1.8 4.5 9.8 6.8 3.24 20.25 96.04 46.24
表10-27 试验方案及结果分析
含水量%B 油炸时间s C
1
1
空列 1
2Hale Waihona Puke 2211
2
2
2
1
1
2
1
2
1
2
1
2
2
2 11.4
1 10.2
1 12.1
11.5
12.7
10.8
空列 1 2 2 1 2 1 1 2
3.24 11.4 F0.01(2,4)=18.0
0.16
0.41
0.285
显著水平 ** *
因素A高度显著,因素B显著,因素C不显著。 因素主次顺序A-B-C。
(3)优化工艺条件的确定
本试验指标越大越好。对因素A、B分析,确定优 水平为A3、B1;因素C的水平改变对试验结果几乎无影
响,从经济角度考虑,选C1。优水平组合为A3B1C1。 即温度为58℃,pH值为6.5,加酶量为2.0%。
K2k2 SST=QT CT
…
Kmk2 SSk
Q
=
j
1 r
正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法(一) 正交设计的基本概念正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:A因素是氮肥施用量,设A1、A2、A3 3个水平;B因素是磷肥施用量,设B1、B2、B3 3个水平;C因素是钾肥施用量,设C1、C2、C3 3个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理表11-1 33试验的全面试验方案正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。
图1中标有‘9 ’个试验点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。
即:(1)A1B1C1(2)A1B2C2(3)A1B3C3(4)A2B1C2(5)A2B2C3 (6)A2B3C1(7)A3B1C3(8)A3B2C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C 因素的各个水平在试验中各搭配一次。
第6章-正交试验设计结果的方差分析

(4)计算F值
• 各均方除以误差的均方,例如:
FABiblioteka VA Ve或FA
VA V e
FAB
VAB Ve
或
FAB
VAB Ve
(5)显著性检验
• 例如: • 若 FAF(fA,f,e)则因素A对试验结果有显著影
响 • 若 F A BF (fA B,fe,)则交互作用A×B对试验结
果有显著影响
(6)列方差分析表
设:
QT
n
x
2 i
i1
n
T xi i1
②各因素引起的离差平方和
• 第j列所引起的离差平方和 :
Sj
1( m r p1
Kp2j
)T2 n
k
ST S j Se j 1
③交互作用的离差平方和
• 若交互作用只占有一列,则其离差平方和就等于 所在列的离差平方和
• 若交互作用占有多列,则其离差平方和等于所占 多列离差平方和之和,
• 例:3时
S S S AB ( AB ) 1 ( AB ) 2
④试验误差的离差平方和
• 方差分析时,在进行表头设计时一般要求留有空 列,即误差列
• 误差的离差平方和为所有空列所对应离差平方和 之和 :
Se S空列
(2)计算自由度
①总自由度 :=n-1 ②任一列离差平方和对应的自由度 :
=m-1 ③交互作用的自由度 :(以A×B为例) ×B= × ×B=(m-1 ) 若m = 2, ×B= 若m = 3, ×B= 2 + ④误差的自由度:
• 方差分析的基本步骤如下: • (1)计算离差平方和 • (2)计算自由度 • (3)计算平均离差平方和(均方) • (4)计算F 值 • (5)显著性检验
第三章 正交试验设计(2)-正交试验数据方差分析和贡献率分析

σ = ˆ
t 0 .975
132 / 4 = 5.74 , 。 ( 4 ) = 2 . 7764
μ 3⋅2
的0.95的置信区间是:
68 ± 2.7764 × 5.74 / 1.8 = 68 ± 11.9 = (56.1,79.9)
贡献率分析
当试验指标不服从正态分布时, 进行方差分析的依据就不充分,此 时可以通过比较个因素的“贡献率” 衡量因素作用的大小。
μ 3.2 的 1 − α 置信区间为: μ 3.2± t1−α / 2 ( f e′)σ / ne ˆ ˆ
′ ˆ 这里 σ = S e / f e′ , ′ S e = S e + 不显著因子的平方和, f e′ = f e + 不显著因子的自由度,
ne = 试验次数 1 + 显著因子自由度之和
n e = 9 /( 1 + f A + f C ) = 9 / 5 = 1 . 8 , ′ S e = S e + S B=132 , f ′ = f + f =4 ,
ˆ ˆ μ = y = 50 , a3 = T13 − y = 61 − 50 = 11 ,
ˆ c 2 = T32 − y = 57 − 50 = 7 ,
•A3C2 水平组合下指标均值的无偏估计可以取为: ˆ ˆ ˆ ˆ μ 3⋅2 = μ + a3 + c 2 = 50+11+7=68。
区间估计
… Continue
因子水平表 因子 A:反应温度(℃) B:反应时间(分) C:加碱量(%) 水平 一 80 90 5 二 85 120 6 三 90 150 7
试验计划与试验结果
试验号 1 2 3 4 5 6 7 8 9 因子 反应温度 ℃ (1)80 (1)80 (1)80 (2)85 (2)85 (2)85 (3)90 (3)90 (3)90 反应时间 分 (1) 90 (2)120 (3)150 (1) 90 (2)120 (3)150 (1) 90 (2)120 (3)150 加碱量 试验结果 y % 转化率(%) (1)5 31 (2)6 54 (3)7 38 (2)6 53 (3)7 49 (1)5 42 (3)7 57 (1)5 62 (2)6 64
正交试验的方差分析

x 1 4
20 K 1
5 l 1
xkl
1 4
4 K 1
xk
4.2
• 依次求出Q、f、S2、F,与F表比较 2 Q1=10 (xi1 x )2 i 1 =10×[(3.65-4.2)2+(4.75-4.2)2]=6.05
• 其余Qj (j=2,3)同理可求
45
Qr
(xkl xk )2
产率
产率
﹪
-55
xK
50
-5
59
4ቤተ መጻሕፍቲ ባይዱ
56
1
58
3*
55
0
58
3
47
-8
52
-3
x = -5/8
(1)方差分析 • 依次求出Q、f、S2、F,与F表比较
第1列差方和:
2
Q1=4 (xi1 x )2 i 1 = 4{[3/4-(-5/8)]2+[(-2)-(-5/8)]2} = 121/8
• 其余Qj(j=2…7)同理可求
9-3-2 关于Qr的计算 一 表头留出空白列
其它的列若与空白列的Q值相近,加起来共同作 为Qr的估计值,可以提高方差分析检验的灵敏度(自 由度增大了)
二 无空白列
1 根据以往资料
若已知 2 ,可认为fr=∞,此时
F
Q因子 / f因子
2
,查表 Fα (f因子,∞)
2 选更大的正交表,从而留出空白列
1
2
2
1
1
2
2
1
2
2
1
2
1
1
2
3
2
-12
-12
-4
-5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节正交试验设计及其方差分析
在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果.
1.正交试验设计的基本方法
正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.
正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:
(1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2.
列数
↓
L4 (23)
↑↑
行数水平数
(2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个.
最多能安排的因素数
↓
L4(23)
↑↑
试验次数水平数
(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的.
L4(23)
↑↑
实际试验数理论上的试验数
正交表的特点:
(1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.
(2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,
数字1,2间的搭配是均衡的.
凡满足上述两性质的表都称为正交表(Orthogonal table).
常用的正交表有L9(34),L8(27),L16(45)等,见附表.用正交表来安排试验的方法,就叫正交试验设计.一般正交表L p(n m)中,p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.
例9.7 提高某化工产品转化率的试验.
某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D有关.为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验.根据以往的经验,确定各个因素的3个不同水平,如表9-18所示.
分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件.
解本题是4因素3水平,选用正交表L9(34).
把表头上各因素相应的水平任意给一个水平号.本例的水平编号就采用表9-18的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示.
从表9-20看出,第一行是1号试验,其试验条件是:
反应温度为60℃,反应时间为2.5小时,原料配比为1.1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1.
由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9-20安排试验,试验的结果依次记于试验方案右侧,见表9-21.
2.试验结果的直观分析
正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.
例9.7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A3B3C2D1.由于全面搭配试验有81种,现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析.
(1)极差计算
在代表因素A的表9-21的第1列中,将与水平“1”相对应的第1,2,3号3个试验结果相加,记作T11,求得T11=151.同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T21,求得T21=183.
一般地,定义T ij为表9-21的第j列中,与水平i对应的各次试验结果之和(i=1,2,3; j=1,2,3,4).记T为9次试验结果的总和,R j为第j列的3个T ij中最大值与最小值之差,称为极差.
显然T=
3
1ij
i
T =
∑,j=1,2,3,4.
此处T11大致反映了A1对试验结果的影响,
T21大致反映了A2对试验结果的影响,
T31大致反映了A3对试验结果的影响,
T12,T22和T32分别反映了B1,B2,B3对试验结果的影响,
T13,T23和T33分别反映了C1,C2,C3对试验结果的影响,
T14,T24和T34分别反映了D1,D2,D3对试验结果的影响.
R j反映了第j列因素的水平改变对试验结果的影响大小,R j越大反映第j列因素影响越
大.上述结果列表9-22.
(2) 极差分析(Analysis of range)
由极差大小顺序排出因素的主次顺序:
主→次
B;A、D;C
这里,R j值相近的两因素间用“、”号隔开,而R j值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B,即反应时间.其次是要考虑因素A和D,即要控制好反应温度和真空度.至于原料配比就不那么重要了.
选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例9.7中,希望转化率越高越好,所以应在第1列选最大的T31=185;即取水平A3,同理可选B3C1D3.故例9.7中较好的因素水平搭配是A3B3C1D3.
例9.8某试验被考察的因素有5个:A,B,C,D,E.每个因素有两个水平.选用正交表L8(27),现分别把A,B,C,D,E安排在表L8(27)的第1,2,4,5,7列上,空出第3,6列仿例9.7做法,按方案试验.记下试验结果,进行极差计算,得表9-23.
表9-23
j 的大小顺序排出因素的主次顺序为
主→次
A、B;D;C、E
最优工艺条件为A2B1C1D2E1.
表9-23中因没有安排因素而空出了第3,6列.从理论上说,这两列的极差R j应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的.
3.方差分析
正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断
因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.
设有一试验,使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记
T =1
p
i i y =∑, y =11p i i T
y p p ==∑,
S T =
2
1
()
p
i
i y y =-∑
为试验的p 个结果的总变差;
S j =2
2
2111n
n ij ij i i T T T r T r
p r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和,其中r =p/n .可证明
S T =
1
m
i
j S
=∑
即总变差为各列变差平方和之和,且总变差S T 的自由度为p -1,第j 列变差S j 的自由度为
n -1.当正交表的所有列没被排满因素时,即有空列时,所有空列的S j 之和就是误差的变差平方和S e ,这时S e 的自由度f e 也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取S j 中的最小值作为误差的变差平方和S e .
从以上分析知,在使用正交表L p (n m )的正交试验方差分析中,对正交表所安排的因素选用的统计量为:
F =
1j
e
e
S S n f -.
当因素作用不显著时,
F ~F (n -1,f e ),
其中第j 列安排的是被检因素.
在实际应用时,先求出各列的S j /(n -1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时,则这第j 列就可当作误差列并入S e 中去,这样使误差S e 的自由度增大,在作F 检验时会更灵敏,将
所有可当作误差列的S j 全并入S e 后得新的误差变差平方和,记为S e Δ,其相应的自由度为f e Δ
,这时选用统计量
F =
1
j e e
S S n f - ~F (n -1,f e Δ
). 例9.9 对例9.8的表9-23作方差分析.
表9-23
解 由表9-23的最后一行的极差值R j ,利用公式S j =2
211
n ij i T T r p
=-∑,得表9-24.
表9-24
表9-24中第3,6列为空列,因此S e =S 3+S 6=1.250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125,S 7/f 7=0.125/1=0.125比S e /f e 小,故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ
=3.整理成方差分析表9-25.
表9-25
由于F 0.05(1,3)=10.13, F 0.01(1,3)=34.12,故因素A ,B 作用高度显著,因素C 作用不显著,因素D 作用显著,这与前面极差分析的结果是一致的.F 检验法要求选取S e ,且希望f e 要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素A 和B 的交互作用A ×B .这类交互作用在正交试验设计中同样有表现,即一个因素A 的水平对试验结果指标的影响同另一个因素B 的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.。