正交实验设计

第一章正交实验设计

§1.1概述

一.实验设计的目标

任何一个试验都存在:如何安排试验及如何分析试验结果这两个问题。对于科学的实验设计应能做到:

1).试验次数尽可能少;

2).少量试验所获数据能得出正确结论。

对单因素或双因素的实验设计,可进行全组合,逐一交叉重复的实验方式,即可以进行全面实验(但水平数必须有限)。

对多于两个因素的,单用全面实验方法,其工作量将随因素的个数按指数方式剧增,即不经济,又费时间。这种全面实验方法不叫优选法,而叫选优法。

对于单因素试验,可采用0.618法,对分法,平行线法,交替法,调优法等优选法进行试验,以减少试验次数。

对多因素,正交实验设计是一种显著有效的方法。

正交试验设计就是利用正交表来合理安排试验的一种方法。

二.基本术语

试验因素:对试验结果可能会产生影响的原因,是实验过程中的一些自变量,或称条件变量,是输入参数。如炼钢中的某些特种元素的含量,机加工

中的刀具形式、走刀量等。

试验指标:试验研究的指标,即实验得出的结果(输出的参数)。

水平:试验因素在试验中所选取的具体状态(或水平)。

如考察刀具磨损。对普通碳素钢:

若温度也为实验因素,如取其三个水平分别为-50℃、20℃及60℃。水平之间的差异也称为水平级位,模糊的说法为低温、常温和高温。

三. 正交设计实验解决的问题

(1). 因素对实验指标的影响,即能分清主要因素和次要因素,或甚微因素和忽略因

素。

(2). 找出较好方案的组合,形成最优的生产条件。必要时,对生产过程作出预报。

上例中,就有这样的问题,选怎样的组合,使刀具磨损最小。选择怎样的温度,

工艺性最好。

§1.2正交表

一.拉丁方与正交表

正交实验最早起源于拉丁方设计思想

18世纪,普鲁士费里德里希.威廉二世,要举行一次与往常不同的六列方队阅兵式。他要求每个方队的行和列都得由六种部队得六种军官组成,不得有重复和空缺。这样,六个方队中,部队、军官、行和列全部排列均衡。群臣们冥思苦想,无一人能排出这样的方阵来。后来向当时著名的数学家 Eular 请教,由此引起了数学家们的极大兴趣,提出了一个有趣的数学问题:所谓36个军官问题,当时用不同的拉丁字母A, B, C ……表示军官,α,β,γ……表示为团队,交叉排列方阵,称为希腊拉丁方阵。简称拉丁方阵。因希腊字母有限,改用脚标为自然数序列排的方阵n n ij a A ?=)(,n n ij b B ?=)(为n 阶拉丁方阵。

当0))(==?ij ij b a B A (,称为正交拉丁方阵。

直到1901年,G.Tarry 才证明“36个军官的正交问题”为无解。但借用拉丁方阵的构造解决了不少的多因素实验优化问题。数学家们如此重视一个君王独出心裁的阅兵式,并不是为了组织什么花样方阵,而是为了研究具有普遍意义的新的数学思想,即均衡分布的思想,这正是今天正交试验设计的思想基础。

例:有三个因素,每个因素有三个水平的实验,需进行2733

=种全组合搭配试验。

121221321

122222322123223323

131231331

132232332

1332333331112113111122123121

1

3

2

1

3

3

1

3

A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C A B C

上述全搭配试验太多,能不能减少一些呢?

能否每次保留一个因素水平而变动其余的水平进行比对试验呢?

正交试验设计能减少试验次数,又能兼顾均匀搭配的效果!

二.正交表

(1). 定义

设A 是n×k 的矩阵,它的第j 列元素由1,2,……j 构成(也可用别的符号),如果矩阵A 的任意两列元素都搭配均匀,就称A 是一个正交表。如8×7的矩阵:

11

111111112222122112212222112121212212212122112212

21211

2A ????????????

=??????????????

注意到,任意两列的相邻元素所构成的都是完全有序对,都包含有四个相同的数字对(1,1),(1,2),(2,1),(2,2),因此A 是一个正交表。

正交表的性质:

(1) 每一列中各数字(或称水平)出现的次数相同;如上例中都是4次。

(2) 任意两列的号码所构成的水平对中。每个水平对重复出现的次数相同。如上例

中每个水平对重复出现2次。

正交表的特点:

搭配均匀性、组合代表性、综合可比性。

(2). 正交表的种类: a).标准表

凡是标准表,水平数都相等,且水平数只能取素数或素数幂,利用标准表可考察因素之间的交互作用。

根据正交表设计的思想,运用数学方法,将正交实验中多种因素和水平搭配的结果编成表格,这种规格化的表格称为正交实验设计表,简称正交表。简记为符号:()K n L m . 其中 L-----表示正交表

n-----表示实验方案的个数(表的行数) m-----表示试验因素的水平数

k-----表示最多可安排因素的数目(表的列数)

常见的水平数相同的正交表有:

二水平正交表:34(2)L 、78(2)L 、1112(2)L 、1516(2)L 、3132(2)L 、……等

三水平正交表:49(3)L 、1327(3)L 、4081(3)L ……

四水平正交表:516(4)L 、2164(4)L 、85256(4)L …… (1.1)

五水平正交表:625(5)L 、31125(3)L 、156265(5)L ……

最简单的34(2)L ,做四次试验,最多安排2个水平3个因素(而全做3

28=次)。

3(2)L 正交表

b). 混合型正交表

如148(42)L ?混合型正交表。表示1个因素是4个水平的,4个因素是2个水平的,不等水平的混合。其中第一列与其他列的搭配是均匀的。

14(42)L ?

还有如

421212122916167

6

1818(32),(62);

(42),(42);(23),(63);

L L L L L L ?????? (1.2)

……

正交表的构造是一个复杂问题,并非给定参数就能构造正交表,一般查用现成即可,下面仅介绍一般的构造方法。

(3).正交表构造的一般方法

正交表的构造是一个组合数学问题,不同类型的表构造方法差异很大。

(a).正交表的正交性及其变换性

线性代数中,两个向量12(,,......,)n a a a 和12(,,......,)n b b b ,如果内积为0,即

1122......0n n a b a b a b +++=

称该两向量正交。 正交性:

正交表每一列可看成一个列向量,表中数字为因素水平记号(可以数字,或其它代号表示,无本质区别),如二水平的记为1,2,分别用+1,-1来代替也可以。任意两列构成的水平对是一个“完全有序对”,即(-1,-1),(-1,+1),(+1,-1),(+1,+1),重复出现次数相同。则:

[(-1)(-1)+(-1)(+1)+(+1)(-1)+(+1)(+1)]=0????

即二水平正交表任意两列是正交的。 变换性:

表的列地位平等,各列可以置换; 表的行地位平等,各行可以置换; 同一列中的水平可以置换。

上述称为正交表的三种初等变换,经初等变换后的正交表与原表是等价的(或称同构)。

(b )有限域的概念

由全体有理数组成的集合中,其元素是无限多,因此是无限域。 因素和水平数字是有限的,所以它们的域是在有限域内。

记U 是一个有限域,一个有限域至少有两个元素,设3U 是由3个元素0和1、2组成,元素之间可满足加或乘法的定义,但集合3U (0,1,2)的加法和乘法结果显然不属于

3U (如1+2=3),但如果我们新定义两个代数运算(这种运算法则使得运算结果仍是集

合中的元素):

(a b a b +=??

??i i 和之和除以U 中的个数i所得的余数)

a b=(a 和b之积除以U 中的个数i所得的余数)

或:

U ∈?

?

≤≤?t c c

乘法 ,,01

t s

s t c U a b r s qt r r t ∠∈??=?

=+≤≤-?

q 为正整数,t 为U 集中元素的个数。

例: 2U 加法 2U 乘法

1+1=2,2∈2U

2/2=1,无余数,故为零。

3U 加法 3U 乘法

5U 加法 5U 减法

计算结果表明,每行每列均构成独立向量,彼此无关。正交表便利用这种算法构造因素水平的顺序。一般可以设m 为因素的水平数, k 为因素个数,则全组合的试验次数Q 为(即k 维向量的总数):

k Q m = 其独立向量个数的计算式为:

(1)(1)k n m m =--

例如:{}30,1,2U =,三维向量全组合3

327k ==。但其独立向量:

3

(31)(31)13n =--=

于是可利用向量的运算法则构造27行、13列的正交表,1327(3)L

(c )()k n L m 型正交表构成

以49(3)L 表说明其构成方法,是4因素,3水平。其()30,1,2U 中取两维向量2

39

=个(即试验的总次数为9),按顺序置于表的最左列,其独立向量只有4个(4个因素),依次置于正交表的最上面一行各列中,即(1,0),(0,1),(1,1),(2,1)。行向量

()12,a a ,独立的有序对。列向量以表示()12,x x ,水平表中的各水平数,即对应行、列向

量交叉处的数字ij l ,则:

1122ij i j i j l a x a x =?+?

第一行、第一列元素:111111*********l a x a x =?+?=?+?=

第二行、第二列元素:222121222200111l a x a x =?+?=?+?=

第九行、第四列元素:949141924222210l a x a x =?+?=?+?=

注意到,其结果是按有限域运算法则计算得出。

49(3)L 的构造

三.

为充分利用正交表的均衡性与可比性特点,力求达到实验次数少,但能得到实验精度

较高的优化设计,为此,选择时尽量满足下列要求:

(1).水平数相符

等水平实验设计,满足水平相符要求。

不等水平试验设计,可选用混合水平正交表。如没有,可用现有规格化的正交表进行改造

(后述)。

(2).列数容限要求

每一个因素占一列位置。因此选表的列数必须全部能容纳全部因数,当存在空列时,可以将多余空列用来计算实验误差(比重复试验更为经济)。应选择列数最少的正交表,称为列数容限要求。

(3).满足行数要求

行数是各个因素的水平组合,这种组合之间有些是相关的,或者说这些组合不全是独立的,所以行数相符是一种从属条件。

因此在选正交表时,只要试验因素能安排得下,就尽可能用小号的正交表

§1.3正交试验设计的直观分析

根据对试验结果的分析方法不同可分为:直观分析法(极差分析法);方差分析法(统计分析法)。按指标多少,又可分为:多指标试验设计;单指标试验设计

一.单指标正交试验设计

例1.对零件镗孔质量不稳,内径偏差大,需改进工艺操作,确定因素的主次影响程度,探求好的工艺程序。

(1).试验方案设计 (a).确定因素与水平

相关的主要因素有四个,每一个因素的水平3个:

(b).选择正交表

本试验为4因素3水平,选择49(3)L 。

(c).确定试验方案

表头行为因素,水平按水平表“对号入座”。指标为内孔偏差量。

试验结果分析

①.直观分析。3213A B C D 差组合最好,偏差量为0.050mm ,是否为最佳呢?

②.计算分析

每一列水平相关的结果进行累加

10.390.1450.3100.845A k =++=,10.3900.2850.2850.960B k =++=,

20.2850.3350.3500.970A k =++=,20.1450.3350.050.530B k =++=, 30.2850.050.3150.650A k =++=,30.3100.3500.3150.975B k =++=,

同理可计算123,,c c c k k k 。并且分别求出其平均值,并计算平均值的极差(最大的数-

最小的数=R)。

可以看出:

a. 刀具数量越多,偏差量越小,4把刀为最好,可考虑刀具再多的情况。

b. 切削速度以38r/min 偏差最小。

c. 走刀量为0.7mm/r 偏差量最小(表中试验结果为0.6mm/r 偏差小)。可考虑走刀量再增大情况。

d. 以II 型刀具为最好。

另外,从极差看因素的作用:

极差大――说明因素对指标的影响大,常为主要因素 极差小――说明因素对指标的影响小,常为次要因素

因此,本例中主次次序:BDAC (转速、刀型、刀数量、走刀量)

注意到:寻找考察指标越大越好的条件时,选取i k 或i k 为最大的水平组合为最优;

寻找考察指标越小越好的条件时,选取i k 或i k 为最小的水平组合为最优

一般最终确定水平后,要做再现性的验证试验,即再做第二批、第三批的验证试

验。

④. 直接分析与计算分析的关系

32133223A B C D A B C D ?

??

直接分析时:计算分析时: 为什么不统一?

对直接分析结果:原4381=次试验,这里由正交表只选出9个,只1/9。凭借正交表的正交性,这9个条件均衡分散在81个试验条件中,代表性很强,所以偏差最小的3213A B C D 在9个试验中效果相当好,但毕竟只做了总试验次数的1/9,只能代表,不能全部复盖。

计算分析: 是为了展望更好的条件(搅混了水,再摸鱼)。对大多数项目,计算分析得到的好条件往往不在已做过的试验中,比如3223A B C D 条件,将会得到超出直接分析的好条件,这正体现了正交试验设计的优越性。但有时也会得出的结果不如直观分析,直观分析与计算分析不一致时,应仔细分析原因,如:①.试验误差大;②.还有别的因素未考虑;③.因素的水平选择不当等。这时往往需再做试验。

二.多指标正交试验设计

生产实践中考察的指标不只一个,这类试验设计称为多指标正交试验设计。往往各指标之间可能存在一定的矛盾,如何兼顾各个指标来选优,有多种方法。

1. 综合平衡法

我们以下例来说明这种方法的应用

指标:拉脱力1000F N ≥, 轴向油隙0.02mm δ≤,转角20α?≥。

因素:D ?、高度L 、倒角k β?、收口压力P 等四个因素。 水平:各因素均取三个。

选用4因素3水平正交表49(3)L ,然后对号入座。每个试验条件做7次,每次试验对三个指标测定并取其平均值。计算分析试验数据,并选取最优生产条件。

按极差大小排列,得出因素主次顺序: 主 → 次 拉脱力 BDCA

轴向游隙 BDCA

转角 BDCA 得出BDCA (对转角α,C 、D 两因素极差R 相差不大)。

综合平衡选优

对因素B (高度L ):轴向游隙小,转角为大角度,应选1B ,但主要考虑拉脱力,故

选2B (拉脱力最大)。

对因素C (倒角): 明显1C ,拉脱力大,游隙小,转角大。

对因素D (收口压力):应选3D ,游隙小,转角2D 与3D 差不多,拉脱力3D 最高 对因素A (直径): 对三个指标来说均是次要因素,从转角大一点,游隙小些的角

度,选1A 综合平衡后:选1213A B C D 为最优生产条件。

2.综合评分法

(1).排队综合评分法。

当几个指标在整个效果中间等同重要,则可按试验结果的情况,综合几个指标, 按效果好坏,从优至劣排队,然后按规则进行评分(可用100分、10分、5分制均 可)。

这种方法中,经验、专家知识很重要! (2).加权综合评分法。

用公式1122......i i i i i ij ij Y b Y b Y b Y =+++

ij b ――权因子系数,表示多项指标在综合加权中应()的权重

ij Y ――所考虑的指标

i ――第i 号试验

j ――第j 个考察指标

如果考察指标趋势相同,则符号相同;趋势不同,符号相异。如果第二项指标与其它不同,则-22i i b Y 。

三. 混合型正交试验

实际工作中,试验受到设备、材料、生产条件等限制,不可能做到每个因素都是等水平的,或在各试验中,重要考察的因素,多取几个水平,因而会遇到不同水平的正交试验。

解决办法有

(1).直接选用现成的混合水平正交表。

混合型水平正交表和普通正交表一样,具有均衡搭配和综合可比的特点,即每列之中各水平出现的次数相同,行与列之间是正交有序的。

如有一实验设计,考察4个因素,其中:因素1为4水平,因素2、3、4均是2水平。此时可选用148(42)L ?的混合水平正交表。

)24(418?L

注意:(1).由于每个因素有不同的水平数,因此计算每个相应水平的平均试验结果不同。

如A 因素,1A 是2次试验结果的平均。而B 、C 、D 因素,1B 、1C 、1D 都是4次试验结果的平均。因此要消除试验次数不等对试验结果平均的影响。

(2).极差R 的折算,当因素水平相同时,因素的主次顺序完成由极差R 决定。水平

不同时,直接比较欠妥,因为,若两个因素对指标值有影响,一般水平数多的因素极差可能大些,此时可用一个系数把极差R 折算后再比较。推荐式:

R d R '=?

d ―――是折算系数

r ――因素中每一个水平试验的重复次数

R ――因素的极差

每个i R 都折算,然后按前面所示的方法画出指标因素关系图,找出主次因素。

四.考虑交互作用的正交试验设计

在实际试验中,不仅因素对指标有作用,而且因素之间还会联合搭配起来对指标产生影响,因素对试验的总效果是每个因素对试验的单独作用再加上各因素的搭配作用决定,这种联合搭配的作用叫做交互作用。

两列间交互作用表

如有A 、B 、C 三个因素(都是2水平的),并考虑A ×B 、A ×C 、B ×C 的交互作用。这相当于有6个因素,在试验设计中,交互作用一律当作因素看待。因此选用78(2)L 表。

78(2)L 正交表安排试验

注意:

交互作用所占的列的位置是一定的,不能任意排,它有交互作用的列位顺序,如上例,A B ?的位置只能在第3列。不像因素独立时,可任意将因素排列。交互作用的表头设计必须严格按交互列表进行配列,这是有交互作用的正交设计的一个重要特点。

(1).交互作用试验设计的表头设计

7(2)L 二列间交互作用表

还有516(2)L 、3030(2)L 等表可查。 从上例中,看表头设计是否符合? (12)A B ??,(1)、(2)交互列为3

(14)A C ??,(1)、(4)交互列为5

(26)B C ??,(2)、(6)交互列为6 完全符合!

表头排好后,按正常的因素水平表确定关系,对号入座,获得正交试验方案。由于交互作用不是具体的因素,因而交互作用在试验方案中不会出现。在分析试验结果时,可以把它看成一个单独因素,同样计算极差,以便反映交互作用的大小。

必须指出:在交互试验设计中,必须遵守一个因素占据一列的原则,如果由于列数不够因素分配,宁可选用规模较大的正交表,也不允许因素共列现象,否则必然会产生“数据混杂”,比如:

7(2)L 表头设计

在3、5、6列上的数据会两两混杂,说不清是那两列的交互作用,只有肯定了有一两两因素无交互作用时,才有价值。因此,当参与因素为m 个时,二列间交互作用要

2

1(1)2m C m m =-?列。如果要考察全因素交互效应,选用的正交表的列数至少等于

1

(1)2

m m +?列。一般不考虑多级的交互作用,应有选择地合理地考察交互作用,这样才能突出正交试验设计可以大量减少试验次数的优点。

(2).交互作用的试验结果分析

例3. 消除用材料172Cr Ni 制造叶片的脆性,目的提高延伸率。寻找生产工艺参数。其中固定因素为浇铸速度3~5秒,模壳预热1080oC,保温1小时。需要研究的因素及其相应的水平如表所示。

除考察上述5个因素外,还要考察,,,A B A C B E D E ????交互作用。

(a) 选正交表,至少需九列表,四列交互,5列独立因素,选1516(2)L (b) 表头设计

要仔细查对交互表,每一列可能排列的因素,再分析其可能性。

注意到表头排列不是唯一的,不妨可以试试!

(c) 试验结果分析

1).计算K 值,极差值。 2).分析找出影响的主次顺序

D E ?、A B ?、A C ?、A 、C 、B 、B E ?、E 、D 。

可以看出:D 、E 交互作用很大,而本身的影响因素较小。

那么D 、E 各什么样的水平又为最佳组合呢?

D ×E

A B ?

从而可以得优选组方案:21111A B C D E ,即含炭量为 0.7%,含镍量为2.5%,含铜量

0%,出炉温1620c

,不造型冷却为最佳。@

我们也可以通过应用“析因设计”的分析方法研究因素的交互作用。先看两个两因素两水平的例子:

例一: 如A 、B

从1A 水平变到2A 水平的效应为

A =(40+52)/2-(20+30)/2=21 从1

B 水平变到2B 水平的效应为

B =(30+52)/2-(20+40)/2=11

对1B 、2B 参与试验,A 水平变化的响应量分别为40-20=20和52-30=22,

对1A 、2A 参与试验,B 水平变化的响应量分别为30-20=10和52-40=12,

说明: A 因素的水平变化比B 因素的水平变化要显著;

B 因素的参与对A 因素影响不大;

从1A 水平变到2A 水平的效应为 A =(50+12)/2-(20+40)/2=1 从1B 水平变到2B 水平的效应为

B =(40+12)/2-(20+50)/2=-9

对1B 参与试验A 水平变化的响应量为50-20=30

对2B 参与试验A 水平变化的响应量为12-40=-28 说明:A 因素的水平变化对响应的影响不大;

B 因素的水平变化比A 因素的水平变化要显著。

B 因素的水平变化对A 因素的响应影响很大,A 的效应依赖于B 的水平变化,

即A 与B 因素之间有交互作用。

(上两例用图示直观反映它们的交互作用) 再看

从1A 水平变到2A 水平的效应为

A =(39.8+24.2)/2-(19.8+25.6)/2=9.3 从1

B 水平变到2B 水平的效应为

B =(25.6+24.2)/2-(19.8+39.8)/2=-4.9

对1B 参与试验A 水平变化的响应量为39.8-19.8=20

对2B 参与试验A 水平变化的响应量为24.2-25.6=-1.4 说明:

A 、

B 因素的水平变化对响应均有影响;

1B 水平参与对A 因素响应的影响显著,而2B 参与试验对A 因素响应的影响不大;

因此可以认为,B 因素中的1B 水平参与对A 因素的响应影响很大,A 的效应也依赖于B 的水平变化,即A 与B 因素之间有交互作用。

D 、

E 的析因分析将有同样的结果。(画图示说明)

§1.4 正交试验的一般步骤

1.明确实验目的,确定考察指标

2.挑因素,选水平,制定因素水平表

3.选正交表,进行表头设计,定试验方案

4.试验、填数据

5.计算分析试验数据,找最优方案(计算

i

K,画整体图,排主次顺序,初选方案,分析后定终选方案)

6.验证试验(第二批试验)

§1.5 试验设计的方差分析

直观分析法(极差分析法):

计算工作量少,简单易懂,可直观判断。但:不能把实验条件引起波动,与试验误差引起的波动区分开,对影响试验结果的各因素的重要程度不能作量化估计。

下面介绍的方差分析方法可以弥补直观分析方法的不足,可提供一个标准来判断多因素的作用是否显著。

一. 单因素试验的方差分析

在一项试验中,若只有一个因素在改变,而其它因素保持不变,这就叫单因素试验。为考虑某因素对试验结果的影响,设有m个实验条件(m个水平),每个条件进行n次试验,每次试验结果都是一个随机变量,同一条件下n次重复试验的结果是同一总体的一个样本,m个条件下,就有m个样本,根据m个样本值分析实验条件的变化对所考察指标有无显著影响,实际是考察m个总体的数学期望值有无显著差异,因而这是一个假设检验问题。

下面通过一个单因素试验的例子来介绍方差分析的主要过程。

在前面的一个柱塞组合强度例子中得出了优选方案

1212

A B C D,因素的主次顺序

BDCA, 其中柱塞头高B是主要因素,在B的三个因素中以

211.8

B=mm为最好,试问:如再增加B尺寸,是否拉脱力F为更有利?

为此取

111.8

B=mm,

211.9

B=mm,做单因素对比试验,若每个水平(试验条件)重复5次,其结果如下:

1

F:10550,10500,10600,10450,10700,F=10560

2

F:10800,10650,10750,10700,10600,F=10700

将上述数据简化列表如下:

从上述10个数据看,数据有波动,其原因:

①.由于高度取了两个不同水平,条件不同了,即因素的水平变化了,

称为条件误差(或称为因素波动误差);

②.由于试验中总存在材料、设备工具、操作方法,测试技术等微小变化,

即在同一条件(水平)下引起的误差,称为试验误差; ③.试验的总误差(它是条件误差和试验误差的总和)。

方差分析方法就是找这三者之间的关系,并作显著性判别。 (1). 试验误差引起的数据波动

如每次试验中没有误差,即每个试验数据都应该等于它们的理论期望值μ,但实际是不可能的。μ不能直接测得,只能用试验结果的平均值来代替μ,即用i x 代替μ。近似地反映误差的大小,(5-5.6),(5.0-5.6)??????等。

在这里,误差的正负是没有意义的,只需反映它的绝对值范围,因此取误差值的平方和(因为正负累加要抵消)。

用同一条件下5次试验的数据与其平均值之差的平方和来估计试验误差。

1B 条件: 2

22221 5.5 5.6(5.0 5.6)(6.0 5.6)(4.5 5.6)(7.0 5.6) 3.7S +-+-+-+-=误=(-)

2B 条件:22222(6.57.0)(7.57.0)(7.07.0)(6.07.0) 2.5S +-+-+-+-=误2=(8.0-7.0) 总偏差平方和 :1 3.7 2.5 6.2S S S =+=+=误误误2

(2). 因素水平变化引起的数据波动(条件误差) 各水平条件下的平均值为5.6与7.0, 总平均值为

1

(5.67.0) 6.32

+=,即条件变化后围绕着6.3在波动,因此用各水平下数据平均值与总平均值之差的平方和来估计由于水平变化等引起的数据波动

假设1B 水平的平均值,可以代表1B 条件下各次试验的数据。2B 也类似,用S 因表示:

2222125()5()5[(5.6 6.3)(7 6.3)] 4.9S x x x x =?-+?-=-+-=因

如有m 个水平,K 次试验重复,则: 2

1

1

()

m

i S K x x ==?

-∑因

一般上式不方便,可以改用如下的实用公式:

1

1

K

i ij j x x K ==

∑, 11111m m K

i ij i i j x x x m K m =====?∑∑∑ 2

2

2

2

221

1

1

2

2211112

21

1

[(2)(2)11()()1()m

m

m

i i i

i i i i i m

K m K ij ij i j i j m

K

ij i j S K x x x x K x x x mx K x Kmx K x Km x K Km T

x Km

K

==========-+=-+=-=-=-∑∑∑∑∑∑∑∑∑

∑因

其中 11

m K

ij

i j T x

===

∑∑

(3).总误差的数据波动

用10次数据与总平均值的方差表示:

21

)K

ij j S x =-∑∑m 总i=1=(x 222(5.5 6.3)(5.0 6.3)(6 6.3)11.1=-+-+??????+-=

从上述可见,S S S 因总试=+=4.9+6.2=11.1

S 总实用公式可写为(计算时可减少累积误差)

2

211

m K

ij i j T

x Km

==-∑∑总S =

上述简明地证实三者数据之间的关系。 (4). 平均波动平方和

前述的S 试和S 因是与试验数据个数有关,数据越多,这种平方和越大,因此要消除这种数据个数的影响。

先引入自由度的概念。所谓自由度就是独立数据的个数,是与试验数据有关的一个统计量,平方和若由n 项组成,它的自由度就是n -1,比如S 试有5个数据

(5.5,5,6,4.5,7),它们之间有一个关系式:

(5.5+5+6+4.5+7)/5=5.6 即5个数据中只有5-1=4个数据对其平均值独立,所以1S 误有1f 误=4个自由度,同样S 误2有2f 误=4个自由度

如果一个平方和数据是由几部分组成,则总的自由度等于多部分的自由度之和。

f 误=1f 误+2f 误=4+4=8 (也可用f 总-f 因计算)

f 因=2-1=1 (某因素的水平数-1)

f 总=10-1=8+1=9 (总的试验次数-1,或两者之和)

因此只要将因素变动,误差变动分别除以它们的自由度便消除了数据个数的影响。

/S f 误误 ――试验误差平均变动平方和

/S f 因因 ――因素的平均变动平方和

(5). 显著性检验

我们可以比较/S f 因因和/S f 误误的大小,若两者差不多,则认为因素的水平改变对指标影响不大,无显著差异;若/S f 因因>/S f 误误,说明因素的水平变化对指标影响超过了试验误差造成的影响。但大多少才能这样说呢?这需要有一个显著性判别的标准,这个标准要确定一个F α临界值(F 分布是适用于对两个子样的方差作比较)。F α按统计学原理已编制成F 分布表,根据置信度来定值(因为我们计算的是方差比,即统计量与F 相同,故选用F 分布检验)。

利用F 分布表作显著性检验的一般步骤(以本例为解): <1>. 计算:()(4.9/1)/(6.2/8) 6.32B F S f S f ===因因误误)/( <2>. 查F 表:

首先选定α值,视情况而定,通常试验精度很差时,α可取得大些,反之取小些。通常α=0.01~0.1. α值置信度是表示判断错误的概率,比如:α=0.05,(1-α)×100%=95%, 当F β>F α时,就可以说,有95%的把握说因素变化对指标影响是显著的,这里若分别取α=0.05和α=0.01,查表:

0.05(1,8) 5.32F = 0.01(1,8)11.3F =

<3>常规判别准则

F β>0.01F 说明该因素水平变动对指标有高度显著影响

0.01F >F β>0.05F 说明该因素水平变动对指标有显著影响

0.05F >F β>0.10F 说明该因素水平变动对指标有较显著的影响(或一定影响) 0.10F >F β>0.25F 说明该因素水平变动对指标不显著但有影响

本例中,0.010.056.32F F F β>=>,所以有显著影响的。

二. 正交试验设计的方差分析

实际问题中,影响结果的因素往往是多个,这时需要分析多因素的作用。下面以一例子加以说明。

例4.弹簧回火工艺试验。

目的:寻找最佳回火工艺条件(原生产中有时发生弹簧断裂现象)

指标:弹性(越大越好)

因素:

,进行表头设计,定试验方案,结果汇总如下:

选正交表4

查表: 0.25(2,2)3F =,0.1(2,2)9F =,0.05(2,2)19F =,0.01(2,2)99F =

结论:因素A (回火温度)显著,主次顺序:ACB,最佳组合为112A B C (均取高指标

值)

注意点:

1. 有交互作用的因素:一般其交互作用的变动等于它所在列的波动,交互作用占有

几列,其波动就是所占各列波动之和。 2. 计算试验误差波动时,可用多种方法:

①.S S S 因总试=-

②. 由未排因素空白列的偏差平方和求得。因空白列没有安排因素,此数据

波动不应包含有因素变动的成份,它只能由误差引起,仅仅反映了试验误差 的大小。

③. 如果某些列的因素变动平方和与空白列的偏差变动平方和相接近,就将

它们合并为试验误差的估计值。因为该因素方差一定很小,其变动对指标影响较小,因此断言该方差值不是因素本身引起的,而是试验误差的一种反应,该因素称为摒弃因素,

④. 有时0S ≈误计算,就从诸因素的变动中,找出其最小值,可作为试验误差 引起的。

⑤. 正交表各列均占满,无空列。此时为了估计试验误差,可选用更大的正

交表,可做重复性试验,重复试验后空白列误差可作为试验误差。

三. 指标值的预报

在验证性实验之前,对最佳生产条件下可能达到的指标值作出估计是十分必要的,特别是在最好条件下估算出长期稳定生产时,期望达到的指标数值,是投产前的一个重要参考依据。

这一期望值又称为工程平均,是实验指标总值与最佳生产对应水平效应之和,对应水平效应是针对显著因素而言,可不考虑摒弃因素的水平效应。

上例中,弹性指标总和T=196, 其总平均值:

?/196/921.78x T n μ==== (1)显著性因素水平1A 的水平效应,可用下式估计(1A 水平的平均值与总体平均值差为1A 的水平效应):

11?170/321.7834.89A A x x α

=-=-= (2) 因素1B 的水平效应,可用下式估计:

11?93/321.789.22B B x x α

=-=-= (3)因素2C 的水平效应:

22?99/321.7811.22C C x x α

=-=-= 总的水平效应: 11221.7834.899.2211.2277.22A B C x x ααα=+++=+++=

还原后的数据

32077.22397.22x =+=

指标的预报是指在某试验条件下,显著性因素相应水平的效应与试验指标总平均值之和。其数学表达式(若以四因素为例,最优组合为i a ,j b ,k c ,l d ):

ijkl i j k l ijkl x x a b c d ε=+++++ ? i x μμε=++∑误 ? ?μμ

ε±误= 其中: i a 、j b ??????是因素水平效应。(工程平均值)

相关文档
最新文档