回归正交试验设计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归正交试验设计

一、概述

(1)回归分析与正交试验设计的主要优缺点

回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。

正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。

(2)回归正交试验设计

回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。

根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。

二、一次回归正交试验设计

(一)一次回归正交试验设计的概念

一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。当只研究一个因素时,其线性回归模型:

y =β0+β1z +e (1)

其回归方程为:

z y ∧

∧∧+=10ββ (2)

式中∧0β、∧

1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2

)的随机变量。可以证明,∧0β、∧1β和∧

y 是β0、β1和y 的无偏估计,即

E(∧

0β)=β0,E(∧1β)=β1,E(∧

y )=y

一次回归正交试验设计是通过编码公式x =f(z) −− 即变量变换,将式(2)变为:

x b b y 10+=∧

(3)

且使试验方案具有正交性,即使得编码因素X的各水平之和为零:

∑==m

i i

x

1

(4)

式中m 是因素x 的水平数。

在回归分析中,回归系数的计算公式为:

x b y b 10-=

xx

xy l l b =

1 (5)

式中:

∑==

N

i i y N

y 1

1

, ∑==N

i i

x

N x 1

1

∑∑∑===-=-=N

i N

i N

i i i i xx

x N x x x l 11

2122)(1

)(

(6)

∑∑∑∑====-

=--=N i N

i N

i i

N i i i i i i xy

y

x N y x y y x x l 11

1

1

1

))((

式中:

xx l —— x 偏差平方和;

xy l —— x 偏差与y 偏差的乘积之和

N—— 试验总数

因此,在一次回归正交试验设计中,由于试验方案具有正交性,则有:

y b =0

∑∑===

N i i N

i i

i x y

x b 1

21

1 (7)

(∑∑===⇒=m i N

i i i x x 1

1

,00 ∵正交表各水平的出现次数相同!)

显然,回归正交试验设计大大简化了计算,同时,编码因素x 的水平数

一般不大于3,使试验方案制定的目的性明确,便于安排试验,可减少试验次数。

(二)回归正交试验设计的一般步骤

1、确定因素的变化范围,对因素水平进行编码

如前所述,回归正交试验设计的基本点是,利用正交试验设计安排试验,运用回归分析方法处理数据,从而减少试验次数,迅速得到回归方程。而连接这两种方法的“桥梁”是对因素的水平进行编码。试验前,每个因素各水平的取值,必须满足编码的要求,数据处理时才能大大简化计算。因此,编码是回归正交试验设计的关键环节,也是回归正交试验设计与一般的正交试验设计的主要区别。

所谓因素的水平编码,就是对因素水平的取值作适当的线性变换,构造因素水平与“编码”的一一对应关系,编码后,使因素各水平变换成最简单的整数字码,如-1,+1;-1,0,+1;等等。通过编码使计算大大简化。

欲研究p 个因素z 1,z 2, …, z p 与指标y 的数量关系,须先要确定它们的变化范围。对因素z j ,用z 1j 和z 2j 分别表示其变化的下界值与上界值,即因素z j 的变化区间为[z 1j ,z 2j ]。若试验在z 1j 和z 2j 上进行,则分别称z 1j 和z 2j 为因素的下水平(用-1表示)和上水平(用+1表示),并称它们的算术平均值:

)(2

1

21j j oj z z z += (8)

为因素的基准水平或零水平(用O 表示),而称它们差值的一半:

)(2

1

12j j j z z -=∆ (9)

为因素的变化区间。

相关文档
最新文档