二次回归正交试验

二次回归正交试验
二次回归正交试验

二次回归正交试验

为了检测某种原料的吸水倍率,重点考察氮肥含量和催化剂对试验指标的影响,已知氮肥含量(x1)的变化范围为0.7~0.9,催化剂(x2)的变化范围为1~3 mL,用二次正交组合设计分析出这两个因素与试验指标(y)之间的关系。

(1)因素水平编码

计算依据

m=2,取m0=2,根据星号臂γ计算公式或查表得γ=1.078

X(1γ)=0.9 ,x(-1γ)=0.7, x(10)=0.8

Δ1=(0.9-0.8)/1.078=0.093

X(2γ)=3 ,x(-1γ)=1, x(10)=2

Δ2=(3-2)/1.078=0.93

(2)试验方案

借助excel分析如下:

①回归方程显著性检验:F=186.5564,,

,12.4)74(95.0=F 因此回归方程非常显著。

'74.41'37.2375.656.2609.952.468y 212121z z z z z z ----+= ②偏回归系数的显著性检验

9

.496.113305.113806.113308.47058.14583.1822.44615.5528.4705701.274.41)(8.1458701.224.23)(3.182475.6)(2

.4461324.656.265.552324.609.95.113801046852206303)(122111221221222222221

121111221

21212

1222

1222222

112112212

1

=-=-==++++=++++==?===?===?===?===?===-=-=∑∑∑∑∑∑∑=======R T e R n

i i

n i i n

i n

i i n i i

n i i n i i

T SS SS SS SS SS SS SS SS SS z b SS z

b SS z z b SS z b SS z b SS y n y SS 方差分析:

dfT=n-1=10-1=9 df1=df2=df12=df1’=df2’=1

dfR=df1+df2+df12+df1’+df2’=1+1+1+1+1=5

dfe=dfT-dfR=9-5=4

MS1=522.5/1=522.5 MS2=SS2/df2=4461.2/1=4461.2 MS12=SS12/df12=182.3

MS1’=SS1’/df1’=1458.8

MS2’=SS2’/df1’=4705.8

MSR=SSR/dfR=11330.6/5=2266.1

MSe=SSe/dfe=49.9/4=12.5

F1=MS1/MSe=522.5/12.5=41.8

F2=MS2/MSe=4461.2/12.5=356.9

F12=MS12/MSe=182.3/12.5=14.6

F1’=MS1’/MSe=1458.8/12.5=116.7

F2’=MS2’/MSe=4705.8/12.5=376.5

FR=MSR/MSe=2266.1/12.5=181.3

F0.01(1,4)=21.20 F0.05(1,4)=7.71

F0.01(5,4)=15.52 F0.05(5,4)=6.26

失拟性检验

本例零水平试验次数m0=2,可进行失拟性检验

5.45.521220521225)509512(2

1)259081262144()(12201020101=-=+-+=-=∑∑==m i i m i i

e y m y SS

SSLf=SSe-SSe1=49.9-4.5=45.4 dfe1=m0-1=2-1=1 dfLf=dfe-dfe1=4-1=3

59

.53)1,3(37.31/5.43/5.45/1/1,01====F df SSe df SS FLf e Lf

Lf

检验结果表明,失拟不显著,回归模型与实际情况拟合很好。 最终的回归方程

y=-1544.0+4539.8x1+227.0x2-78.0x1x2-2678.7x12-48.3x22

回归正交试验设计

回归正交试验设计 一、概述 (1)回归分析与正交试验设计的主要优缺点 回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。 正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。 (2)回归正交试验设计 回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。 根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。

二、一次回归正交试验设计 (一)一次回归正交试验设计的概念 一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。当只研究一个因素时,其线性回归模型: y =β0+β1z +e (1) 其回归方程为: z y ∧ ∧ ∧ +=10ββ (2) 式中∧ 0β、∧ 1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2 )的随机变量。可以证明,∧0β、∧1β和∧ y 是β0、β1和y 的无偏估计,即 E(∧0β)=β0,E(∧1β)=β1,E(∧ y )=y 一次回归正交试验设计是通过编码公式x =f(z) ?? 即变量变换,将式(2)变为: b b y 10+=∧ (3) 且使试验方案具有正交性,即使得编码因素X的各水平之和为零: ∑==m i i x 1 (4) 式中m 是因素x 的水平数。 在回归分析中,回归系数的计算公式为:

二次回归正交试验

二次回归正交试验 为了检测某种原料的吸水倍率,重点考察氮肥含量和催化剂对试验指标的影响,已知氮肥含量(x1)的变化范围为0.7~0.9,催化剂(x2)的变化范围为1~3 mL,用二次正交组合设计分析出这两个因素与试验指标(y)之间的关系。 (1)因素水平编码 计算依据 m=2,取m0=2,根据星号臂γ计算公式或查表得γ=1.078 X(1γ)=0.9 ,x(-1γ)=0.7, x(10)=0.8 Δ1=(0.9-0.8)/1.078=0.093 X(2γ)=3 ,x(-1γ)=1, x(10)=2 Δ2=(3-2)/1.078=0.93

(2)试验方案 借助excel分析如下:

①回归方程显著性检验:F=186.5564,, ,12.4)74(95.0=F 因此回归方程非常显著。 '74.41'37.2375.656.2609.952.468y 212121z z z z z z ----+= ②偏回归系数的显著性检验 9 .496.113305.113806.113308.47058.14583.1822.44615.5528.4705701.274.41)(8.1458701.224.23)(3.182475.6)(2 .4461324.656.265.552324.609.95.113801046852206303)(122111221221222222221 121111221 21212 1222 1222222 112112212 1 =-=-==++++=++++==?===?===?===?===?===-=-=∑∑∑∑∑∑∑=======R T e R n i i n i i n i n i i n i i n i i n i i T SS SS SS SS SS SS SS SS SS z b SS z b SS z z b SS z b SS z b SS y n y SS 方差分析: dfT=n-1=10-1=9 df1=df2=df12=df1’=df2’=1

四种回归设计方法的比较

四种回归设计方法比较表 试验设计方法一次回归正交二次回归正交二次回归正交旋转二次回归通用旋转 特点正 交 性 在p维因素空间内,如果试验方案使所有j个因素的不同水平x ij 满足: ) ; ,..., 2,1 ; ,..., 2,1 ; ,..., 2,1 ( 1 1 j t N t x x N j N i x N i it ij N i ij ≠ = = = = = ∑ ∑ = = 则该方案具有正交性。则,一次回归正交、二次回归正交,及二次回归正交旋转试验均具有正交性, 具有以下特点: 1.利用正交试验设计安排试验,运用回归分析方法处理数据; 2.减少试验次数,适用于因素水平不太多的多因素试验; 3.“均匀分散,整齐可比”; 4.由于试验设计的正交性,消除回归系数之间的相关性,使其具有独立性。 注:二次回归正交旋转中,由公式p m m c 2 ) 1(42/1 - + =计算出m0为整数时,则旋转组合设计是 完全正交的;当m0不为整数时,则旋转组合设计是近似正交的。 一次项系数b j与交互项系数b ij具有 正交性,但常数项b0与平方项回归 系数b jj,以及各平方项回归系数b jj 之间均存在相关,因此不具有正交 性。 旋 转 性 具有旋转性无 具有旋转性(在p维因素空间中,若使用方案使得试验指标预测值 ?的预测方差仅与试验点到试验中心的距离ρ有关,而与方向无关, 因此具有旋转性。) 通 用 性 无 具有通用性(各试验点与中心的 距离ρ在因子空间编码值区间0< ρ <1范围内,其预测值?的方差基 本相等,即具有通用性。)

优点科学地安排实验,用最少的试验次数,获得最全面的试验信息,并对试验结果进行科学分析,从而得 到最佳实验条件,迅速建立经验公式,简化计算。 1.中心点试验次数m0有所减少。 2.试验方案具有通用性与旋转性。消除回归系数之间的相关性,使其具有独立性,剔除回归方程某一 变量时,其余变量的回归系数不变。 1.可直接比较各点预测值的好 坏,找出预测值相对较优的区 域; 2.有助于寻找最优生产的过程 中排除误差的干扰。 缺点1.只适用于因素水平不太多的多 因素试验,且水平数一般不大于 3; 2.适用性具有局限,一次回归方程 经检验可能在区域内部拟合不 好。 试验指标预测值?的方差依靠 试验点在p维空间的位置,影响 不同回归值之间的直接比较。 1.中心试验次数明显增加,对于 试验费用昂贵或试验数据难以 取得的研究不利。 2.在不同半径球面上各试验点 的预测值?的方差不等,不便 于比较。 常数项b0与平方项回归系数b jj、以 及各平方项回归系数b jj 存在相关, 牺牲了部分正交性而达到一致精度 的要求。 因素水平编码试验次 数N N(不包括零水平试验次数) 2 2 2 + = ≥ + + = p c C q N m p m N m0根据试验设计需求而定 p m m m p m N c 2 ) 1(4 2 2/1 - + = + + = m0由公式求得 2m p m N c + + = m0查相关工具表或由公式求得 确定星 号臂r 无 2 ) 2 ( 2c c c m m m p m r - + + = ? ? ? ? ? = = - 实施 实施 全面实施 4/1,2 2/1,1 ,0 , 24i r i p 中心化 处理 无) ,..., 2,1 ; ,..., 2,1 (, 1 1 2 2p j N i x N x x N i ij j j = = - = '∑ = 无

一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计 某产品的产量与时间、温度、压力和溶液浓度有关。实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在 20%~40%,考察Z 1~Z 2 的一级交互作用。 因素编码 Z j (x j ) Z 1 /min Z 2 /o C Z 3 /*105Pa Z 4 /% 下水平Z 1j (-1)30 50 2 20 上水平Z 2j (+1)40 60 6 40 零水平Z 0j (0)35 55 4 30 变化间距 5 5 2 10 编码公式X 1=(Z 1 -35)/5 X 2 =(Z 2 -55)/5 X 3 =(Z 3 -4)/2 X 4 =(Z 4 -30)/10 选择L8(27)正交表 因素x 1,x 1 ,x 3 ,x 4 依次安排在第1、2、4、7列,交互项安排在第3列。 试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi 1 1 1 1 1 1 1 9.7 2 1 1 1 -1 -1 1 4.6 3 1 1 -1 1 -1 -1 10.0 4 1 1 -1 -1 1 -1 11.0 5 1 -1 1 1 -1 -1 9.0 6 1 -1 1 -1 1 -1 10.0 7 1 -1 -1 1 1 1 7.3 8 1 -1 -1 -1 -1 1 2.4 9 1 0 0 0 0 0 7.9 10 1 0 0 0 0 0 8.1 11 1 0 0 0 0 0 7.4 Bj=∑ xjy 87.4 6.6 2.6 8.0 12.0 -16.0 aj=∑ xj2 11 8 8 8 8 8 bj = Bj /aj 7.945 0.825 0.325 1.000 1.500 -2.00 Qj = Bj2 /aj 393 5.445 0.845 8.000 18.000 32.000 可建立如下的回归方程。 Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2 显著性检验: 1、回归系数检验

回归正交试验设计

8 回归正交试验设计 前面介绍的正交试验设计是——种很实用的试验设计方法,它能利用较少的试验次数获得较好的试验结果,但是通过正交设计所得到的优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案;回归分析是一种有效的数据处理方法,通过所确立的回归方程,可以对试验结果进行预测和优化,但回归分析往往只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。如果能将两者的优势统一起来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这正是我们所期望的。回归正交设计(orthogonal regression design)就是这样一种试验设计方法,它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。 8.1 一次回归正交试验设计及结果分析 一次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m 个试验因素x 1,x 2,……,x m ,之间的一元回归方程: $1122m m y a b x b x b x =++++L (8-1) 或者 $1 m j j kj k j j k j y a b x b x x =?=++∑∑ k=1,2,…,m -1(j≠k ) (8-2) 8.1.1 一次回归正交设计的基本方法 (1)确定因素的变化范围 根据试验指标y ,选择需要考察的m 个因素x j (j =1,2,…,m),并确定每个因素的取值范围。设因素x j 的变化范围为[x j1,x j2],分别称x j1和x j2为因素x j 的下水平和上水平,并将它们的算术平均值称作因素x j 的零水平,用x j0。表示。 12j02 j j x x x += (8-3) 上水平与零水平之差称为因素x j 的变化间距,用△j 表示,即: 20j j j x x ?=- (8-4) 或 21 2 j j j x x -?= (8-5) (2)因素水平的编码 编码(coding)是将x j 的各水平进行线性变换,即: j j j x x z j -= ? (8-6) 式(8—6)中z j 就是因素x j 的编码,两者是一一对应的。显然,与x j1,x j0和x j2的编码分别为-1,0和1,即z j1=-1,z j2=0,z j2=1。一般称x j 为自然变量,z j 为规范变量。因素水平的编码结果可表示成表8—1。 对因素x j 的各水平进行编码的目的,是为了使每个因素的每个水平在编码空间是“平等”的,即规范变量z j 的取值范围都在[1,-1]内变化,不会受到自然变量x j 的单位和取值大小的影响。所以编码能将试验结果y 与因素z j (j =1,2,…,m)各水平之间的回归问题,转换成试验结果y 与编码值z j 之间的回归问题,

正交试验结果分析的回归分析方法

正交试验结果分析的回归分析方法 方法简述 本节的题目表明,本方法仅仅是对正交试验结果进行分析的一种方法。在对正交试验结果进行分析之前,如何明确试验指标、因素和水平,如何选择正交表,如何进行表头设计,如何做实验等,与本章所讲的常规的正交试验设计方法是完全相同的。本方法实际上是用正交表来设计试验方案,再用逐步回归方法来处理正交试验的实验数据。用正交表来设计试验方案,目的是使数据点的分布均匀合理;用逐步回归方法来处理实验数据,目的是为了得到有多种用途的数学回归式。 回归模型和回归方法 正交试验设计方法特别适合于解决多因素试验问题。化工上,大多数的实际问题都是多因素的问题,而且多数问题都是非线性的问题。一个适用于多元线性和非线性回归的回归模型,是下式所示的多元二次多项式:(以4个自变量为例) (4-7) 可见,在4个自变量时,若包括b0则待求的回归系数就多达15个。为此实验的次数至少应16次,而且求回归系数的过程和应用回归式求y的计算过程都很长,舍入误差较大。实际上,如同在方差分析时有些列在F检验中会不显著一样,在按式(4-7)进行回归分析时有些项在F检验中也会不显著。若只让F检验显著的项进入和保留在回归式中,则所得的回归式肯定会比式(4-7)简化许多。为此,我们推荐使用逐步回归方法来进行多元二次多项式的回归。 逐步回归方法见本书的第3章3.5.5。在这种回归方法中,用每次选入时至多选入一项,每次剔除时至多剔除一项,选入、剔除交替进行的办法来进行回归操作。该选入时,从当前尚在回归式之外的众“项”中选择F值最大且F检验显著的一项,送入回归式。该剔除时,从当前已在回归式之中的众“项”中选择F值最小且F检验不显著的一项,从回归式剔除出去。由此可知,在最后所得的回归式中,每一项回归系数的F检验都是显著的。

相关文档
最新文档