第8章 回归正交试验设计
回归正交试验设计PPT精品文档

Orthogonal Regression Design
1
正交设计:优方案只能限制在已定的水平上,而不是一定 试验范围内的最优方案
回归正交设计(orthogonal regression design) : ➢ 可以在因素的试验范围内选择适当的试验点 ➢ 用较少的试验建立回归方程 ➢ 能解决试验优化问题 ➢ 不适合非数量性因素
2
8.1 一次回归正交试验设计及结果分析
建立试验指标(y)与m个试验因素x1,x2,…,xm之间的 一次回归方程
例:m=3时,一次回归方程: y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+b23x2x3
➢ 其中x1,x2,x3表示3个因素;x1x2,x1x3,x2x3表示交互作用 ➢ 若不考虑交互作用,为三元一次线形回归方程:
8
(4)试验方案的确定 表头设计 : ➢ 可参考正交设计的表头设
计方法 ➢ 交互作用列的编码等于表
中对应两因素列编码的乘 积 零水平试验(中心试验 )
9
8.1.2 一次回归方程的建立
总试验次数为n : n=mc+m0
➢ mc:二水平试验次数 ➢ m0:零水平试验次数 一次回归方程系数的计算: ➢ 常数项:a ➢ 一次项系数:bj ➢ 交互项系数: bjk
14
例8-1: (1)因素水平编码
15
(2)正交表的选择和试验方案的确定
16
(3)回归方程的建立 ➢ m0=0,n=mc=8 ➢ 计算表 ➢ 计算各回归系数 ➢ 写出y与规范变量zj的回归方程 ➢ 根据偏回归系数绝对值大小,确定因素和交互作用主次 ➢ 根据偏回归系数正负,得到各因素对试验指标的影响方向 (4)方差分析 (5)回归方程的回代:得到试验指标y与自然变量xj的回归
回归正交试验设计

回归正交试验设计一、概述(1)回归分析与正交试验设计的主要优缺点回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。
它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。
因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。
所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。
正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。
(2)回归正交试验设计回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。
根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。
二、一次回归正交试验设计(一)一次回归正交试验设计的概念一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。
当只研究一个因素时,其线性回归模型:y =β0+β1z +e (1)其回归方程为:z y ∧∧∧+=10ββ (2)式中∧0β、∧1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2)的随机变量。
可以证明,∧0β、∧1β和∧y 是β0、β1和y 的无偏估计,即E(∧0β)=β0,E(∧1β)=β1,E(∧y )=y一次回归正交试验设计是通过编码公式x =f(z) −− 即变量变换,将式(2)变为:x b b y 10+=∧(3)且使试验方案具有正交性,即使得编码因素X的各水平之和为零:∑==mi ix1(4)式中m 是因素x 的水平数。
回归正交试验设计45页PPT

21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
6、法律的基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯
8第八章_回归正交试验设计

16
7.1.3 回归分析对数据的处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,对 试验的安排不提任何要求,对如何提高回归方程的精度研究 很少。 后果: (1)盲目增加试验次数,而这些试验结果还不能提供充分 的信息,以致在许多多因子试验问题中达不到试验目的。 (2)对模型的合适性有时无法检验,因为在被动处理数据 时在同一试验点上不一定存在重复试验数据。 为了适应寻求最佳工艺、最佳配方、建立生产过程的数学 模型等的需要,人们就要求以较少的试验次数建立精度较高 的回归方程。
ˆ b0 b1 x1 bp x p y 今后称 A X X 为正规方程组的系数矩阵, B X Y 为正规 1 方程组的常数项向量,C X X 为相关矩阵。 在模型(7.1.5)下,有
b ~ N ( , 2 ( X X ) 1 )
2015-1-9 试验设计与数据处理 9
( xi1 , xi 2 ,, xip , yi ), i 1,2,, n
假定回归模型为:
yi 0 1 xi1 p xip i,i 1,2,, n 2 各 iid ~ N ( 0 , ) i (7.1.5)
2015-1-9
试验设计与数据处理
i 1 i 1 i 1
ˆi )2 ( y ˆ i y) 2 S E S R ST ( yi y ) 2 ( yi y
其中
ˆi )2 S E ( yi y
ˆ i y) 2 S R ( y
i
为残差平方和,自由度为 为回归平方和,自由度为
2015-1-9 试验设计与数据处理 15
当H0j为真时,有 Fj ~ F (1, f E ) 。 给定的显著性水平 ,当 Fj F1 (1, f E ) 时拒绝假设H0j,即认 为 j 显著不为零,否则可以将对应的变量从回归方程中删除。 注:当有不显著的系数时,一般情况下一次只能删除一个F 值最小的变量,重新计算回归系数,再重新检验。通常要到余 下的系数都显著时为止。
正交回归设计(2)

2.检验一次方程的合适性 为了了解是否存在因子间的交互作用,是否有因子的高次效 应,在中心点进行了m=5次试验,结果为: 40.3,40.5,40.7,40.2,40.6 5 其平均值为 y 0 40.46 ,偏差平方和为 S0 ( y0i y0 ) 2 0.172 , i 1 其自由度=4。 采用方法1中的检验统计量t作检验。 ˆ 0 40.425, y 0 40.46 , 现在 y
1u 表示为行向 其中 ,1u 表示元素均为1的u维列向量, 量, I u 表示u阶单位阵,J uv 表示u行v列的矩阵,其元素均为 1, h mc 2 2 ,G是p阶对称方阵,其对角元均为 f mc 2 4 , 非对角元均为mc,即 f mc mc m c f mc G m m f c c
0
S e ( y 0i y 0 ) 2,f e m0 1
i 1
m0
S Lf S E S e,f Lf f E f e
可对二次回归模型的合适性进行检验。
例8.4.1 为提高钻头的寿命,在数控机床上进行试验,考察 钻头的寿命与钻头轴向振动频率F及振幅A的关系。在试验中, F与A的变动范围分别为:[125 Hz,375Hz]与[1.5,5.5],采用 二次回归正交组合设计,并在中心点重复进行三次试验。
(2)用二水平正交表L4(23)安排试验,试验方案与结果如下:
(3)建立一次回归方程:
所得一次回归方程为:
ˆ 40.425 0.775 x1 0.325 x2 y
链接31
对回归方程与回归系数作显著性检验的方差分析表如下:
若取 0.05 ,那么 F0.95 (2,1) 200 ,所以方程在显著性水 平0.05上是显著的,又 F0.95 (1,1) 161 ,则两个系数也是显著 的。
数理统计第八章 正交实验设计

即对于在 A1下的四次试验和 A下的四次试验来说, 2 虽然其它条件( B 、 C、 D)在变动,但这种变动是 A2之间差异反映了A的两 “平等的”,所以 A 和 1 个水平的不同,由于
表 头 设计 列号 试验 1 2 3 4
A
B
C
D
试验 结果
1 1 1 1 1 2 2 2 2 366 358 91.5
5
因此多因子试验问题的突出矛盾是: (1)所有可能搭配的试验次数与实际可行的试验次数之 间的矛盾。 (2)实际所作少数试验与要求全面掌握内在规律之间的 矛盾。 为了解决第一类矛盾,要求必须合理地设计和安排试 验,以便通过尽可能少的试验次数,就可抓住主要矛 盾。 为解决第二类矛盾,要求我们对试验结果作科学的分 析,透过现象看本质,认识内在的规律,为解决问题 提供可靠的依据。
7 8
§8.2 正交表
正交表是试验设计中合理安排试验,并对数据 进行统计分析的主要工具。 正交表用符号 L p (n ) 表示。 “ L ”代表正交表, “ p ”表示表中的行数,即要作的试验次数, “ m ”表示表中有m列,即最多允许安排的因 子 个数, “ n ”表示水平数。
m
L4 ( 23 )
B2
D1
D2
500毫米汞柱 600毫米汞柱
2
我们通常称影响试验指标的因素为因子, 用大写字母A,B,C,…表示; 可能处于的状态称为水平,用该字母加上足标 表示。 例如,A1 ,A2 …表示因子A的第一,第二,… 水平等。 我们把实验中需要考虑多个因子,而每个因子 又有多个水平有待考查的试验问题称为多因子 试验问题。 例8.1.1就是四个两水平的因子试验问题。
3
我们希望通过试验解决的问题是: (1)找出各因子对指标的影响规律,哪个因子是主 要的,哪个是次要的?哪些因子除了各自的单独作 用外,它们之间还产生综合效果?这种综合效果有 多大?对指标的影响,综合效果是主要的,还是因 子的单独作用是主要的?
第八章回归正交试验设计

8回归正交试验设计本章要点:主要讲述了一次回归正交试验设计、二次回归正交试验设计的原理、基本方法和统计分析步骤,并针对不同类型的回归正交试验给出了相应的计算案例。
重点:回归正交试验设计的方法,统计过程中方程的建立以及显著性分析检验。
难点:二次回归组合设计正交性的实现及其统计分析。
8.1 回归正交试验设计简介产品质量通常受多因素的综合影响,试验效应既包括因素的主效应,也包括因素间的交互作用,因此,在产品研究中总希望安排足够多的研究因素以使试验效应有充分的试验论据。
但因素和水平的增加造成试验规模庞大,特别是对于多指标分析的试验往往由于分析困难而无法实施。
线性反应试验一般是研究一个因素多水平的试验设计,面体反应试验是研究两个因素多水平的的试验设计。
当试验因素超过3个的多水平试验时,由于采用组合处理,处理数目等于因素水平间的乘积,它随因素的增加呈几何级数增加。
例如,一个3因素4水平的试验,总共有43=64个试验处理,而4因素5水平的试验就有54=625个处理,由于处理数目太大,不仅增加了试验误差,而且由于受试材和条件的限制,这对产品研究来说是难以实施的。
正交试验设计方法在产品工艺改进、新产品的试制中得到了广泛的应用,它能够利用较少的处理安排较多的试验因素,获得较佳的试验结果。
但是正交设计不能在一定的试验范围内,根据数据样本,去确定变量间的相关关系及相应的回归方程。
如果试验传统的回归分析,又只能被动地去处理由试验所得到的数据,而对试验的设计安排几乎不提出任何要求。
这样不仅盲目地增加了试验次数,而且由数据所分析出的结果还往往不能提供充分的信息,造成在多因素试验的分析中,由于设计的缺陷而达不到预期的试验目的。
因而回归正交试验设计应运而生。
回归正交试验设计是将试验安排与数据的回归分析结合起来考虑。
在试验中,通过适当地安排试验点,使得在每个试验点上获得的数据含有最大的信息,并且各自变量(因素)向量间满足正交性以便于回归分析。
第八章.正交试验设计

第八章.正交试验设计第8章正交试验设计本章要求(1)掌握试验设计的基本概念;(2)掌握正交表的形式与特征;(3)掌握正交设计的试验步骤;(4)熟悉无交互作用的正交设计的数据直观分析方法;(5)熟悉正交设计的统计模型与方差分析;(6)了解正交设计的最佳条件选择。
正交试验设计法是研究与处理多因素实验的一种科学方法。
利用规格化的表格―正交表,科学地挑选试验条件,合理安排实验。
正交试验设计法最早由日本质量管量专家田口玄一提出,称为国际标准型正交试验法。
认为:“一个工程技术人员若不掌握正交试验设计法, 只能算半个工程师”。
我国工业企业特别是化工、纺织、医药、电子、机械行业,正交试验设计法的应用也取得相当的成就,中国数学家张里千教授发明了中国型正交试验设计法。
无交互作用单一指标的正交设计及其基本概念试验设计例为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:A:80-90℃ B:90-150分钟C:5-7% 试验目的是搞清楚因素A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。
试制定试验方案。
这里,对因素A,在试验范围内选了三种状态;因子B和C也都取三种状态:A:A1=80℃,A2=85℃,A3=90℃ B:B1=90分,B2=120分,B3=150分C:C1=5%,C2=6%,C3=7% 当然,在正交试验设计中,因素可以是定量的,也可以是定性的。
而定量因素各水平间的距离可以相等,也可以不相等。
这个三因子三水平的条件试验,通常有两种试验进行方法:(Ⅰ)取三因素所有状态之间的组合,即AlBlC1,A1BlC2,A1B2C1, ……, A3B3C3,共有33=27次试验。
用图表示就是图1 立方体的27个节点。
这种试验法叫做全面试验法。
全面试验对各因素与指标间的关系剖析得比较清楚。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
b3
z
i 1 n
n
3i
yi
mc
b12
(z z
i 1 1
2
)i yi
mc
b13
(z z
i 1 1
n
3
)i yi
mc
得回归方程:
y 0.50475 0.00975 z1 0.03375 z2 0.00575 z3 0.00475 z1 z2 0.00725 z1 z3
增加零水平试验后回归平方和SSR没有变化
②回归方程失拟部分:
失拟平方和
:
SS Lf SST SS R SSe1 SSe SSe1
失拟平方和自由度:
df Lf dfe dfe1
包括其它因素及xj的高次项等引起的差异
③失拟检验 :
FLf
SS Lf df Lf SSe1 df e1
2 c 2
SS3 mc b32 ... ... SS12 m b ... ...
2 c 12 2 SS13 mc b13 ... ...
SS R SS1 SS2 SS3 SS12 SS13 ...
再计算df,MS,F,显著性,得方差分析表
第8章
回归正交试验设计
Orthogonal Regression Design
正交设计:优方案只能限制在已定的水平上,而 不是一定试验范围内的最优方案
回归正交设计(orthogonal regression design) : 可以在因素的试验范围内选择适当的试验点 用较少的试验建立回归方程 能解决试验优化问题 不适合非数量性因素
例8-1: 用石墨炉原子吸收分光光度计法测定食品中的铅, 为提高测定灵敏度,希望吸光度大。为提高吸光
度,对x1(灰化温度/℃)、x2(原子化温度/℃ )
和x3(灯电流/mA)三个因素进行了考察,并考虑
交互作用x1x2,x1x3,已知x1=300-700℃,x2=18002400℃,x3=8-10mV。试通过一次回归正交试验确
8.1.2 一次回归方程的建立
总试验次数为n :
n=mc+m0
mc:二水平试验次数
m0:零水平试验次数
一次回归方程系数的计算:
常数项:a
一次项系数:bj
交互项系数: bjk
1 n a yi y n i 1
bj
n
z
i 1
n
Zji是Zj列各 水平的编码 j=1,2,…,m ZjZk列各水 平的编码 j>k, k=1,2,…,m-1
(3)一次回归正交设计表
将二水平的正交表中“2”用“-1”代换 ,例:
回归正交设计表的特点:
任一列编码的和为0
任两列编码的乘积之和等于0
正交性
(4)试验方案的确定
表头设计 : 可参考正交设计的 表头设计方法 交互作用列的编码 等于表中对应两因 素列编码的乘积
零水平试验(中心 试验 )
对显著性水平α=0.05,只有因素z2对试验
指标y有非常显著的影响,其它因素及交互 作用都无显著影响,故可以将 z1,z3,z1z3,z1z2并入残差,然后再进行方 差分析
得新的回归方程:y=0.50475+0.03375z2
根据编码公式
x2 x20 x2 2100 z2 2 300
①重复试验误差:
平方和:
m0 2 m0 2 0i m0
1 2 SSe1 ( y0i y 0 ) y ( y0i ) m0 i 1 i 1 i 1
重复试验误差的自由度:
dfe1 m0 1
由计算公式可知,只有回归系数a与零水平试验次
数m0有关,其它偏回归系数都只与mc有关,所以
8
二元二次回归正交组合设计
(2) 三元二次回归正交组合设计试验方案
三元二次回归方程:
y a b1x1 b2 x2 b3 x3 b12 x1x2 b13 x1x3 b23 x2 x3 b11x12 b22 x22 b33x32
试验方案
三元二次回归正交组合设计
定吸光度与三个因素之间的函数关系式。
(1)因素水平编码
-1
考虑交互作用x1x2,x1x3
X1
X2 X3
(1) (2) (3) (4) (5) (6) (7)
(2)正交表的选择和试验方案的确定
(3)回归方程的建立 m0=0,n=mc=8 计算表 计算各回归系数 写出y与规范变量zj的回归方程 根据偏回归系数绝对值大小,确定因素和交互作 用主次 根据偏回归系数正负,得到各因素对试验指标的 影响方向 (4)方差分析 (5)回归方程的回代:得到试验指标y与自然变量 xj的回归方程
-1 1
∑
由上表得
1 n 4.038 a yi 0.50475 n i 1 8 b1
z
i 1 n
n
1i
yi
mc
0.078 0.00975 8
b2
z
i 1
2i
yi
mc
0.270 0.03375 8 0.046 0.00575 8 0.038 0.00475 8 0.058 0.00725 8
ji
yi
bkj
(z z ) y
i 1 k j i
mc
i
说明:
mc
求得的回归系数直接反映了该因素作用的大小
回归系数的符号反映了因素对试验指标影响的正负
8.1.3 回归方程及偏回归系数的方差分析
8.1.3.1 无零水平试验时
①平方和:
n 1 SST Lyy ( yi y)2 yi2 ( yi )2 总平方和: n i 1 i 1 i 1 n n
序 号
1 2 3 4 5 6 7 8
z1 z2
z1 z3 z1 z2 z3
y
y2
z1y
z2y
0.552 0.554
z3y
0.552 -0.554
(z1z2 (z1z3 )y )y
0.552 0.554 0.552 -0.554
1 1 1 1
1 1
1 1
1
1
0.552 0.304704 0.552
-1 -1 0.554 0.306916 0.554 1 0.480 0.230400 0.480
一次项偏回归平方和
:
SS j mcb2 j
SSkj m b
2 c kj
交互项偏回归平方和: 回归平方和 残差平方和
: :
SSR SS一次项 SS交互项
SSe SST SSR
②自由度 dfT=n―1
各种偏回归平方和的自由度=1
回归平方和的自由度 :
df R df一次项 df交互项
将上述线性回归方程进行回代, 得有关y与x2的回归方程 Y=6.79525+0.0001125x2
8.1.3.2 有零水平试验时
目的:进行回归方程的失拟性(lack of fit)检验 (要求m0≥2 )
失拟性检验:为了检验一次回归方程在整 个研究范围内的拟合情况 失拟性检验步骤:
设m0次零水平试验结果为y01,y02,…,y0m0
要求:试验次数>回归方程的项数
回归正交组合设计:在一次回归正交试验设计 的基础上再增加一些特定的试验点,通过适当 的组合形成试验方案
8.2.1 二次回归正交组合设计表
(1)二元二次回归正交组合设计试验方案
二元二次回归方程:
2 11 1
y a b1 x1 b2 x2 b12 x1 x2 b x b x
对于给定的显著性水平α(一般取0.1)
当FLf<Fα(dfLf,dfe1)时,就认为回归方程 失拟不显著,失拟平方和SSLf是由随机误差造 成的,所建立的回归方程是拟合得很好
例8-2
8.2 二次回归正交组合设计
回归方程的建立: 根据最小二乘法原理得到正规方程组
求解正规方程组,得回归系数
残差自由度:
df e dfT df R
不考虑交互作用时:dfR=m,dfe=n-m-1。
无论是否考虑交互作用,都不影响偏回归
系数的计算公式
③均方
④F检验:
回归方程显著性检验
偏回归系数显著性检验 :
判断因素或交互作用对试验的影响程度
可直接从回归方程中剔除这些一次和交互 项 经检验不显著的因素或交互作用应归入残 差,重新检验
8.1 一次回归正交试验设计及结果分析
建立试验指标(y)与m个试验因素x1,x2,…,
xm之间的一次回归方程
例:m=3时,一次回归方程:
y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+ b23x2x3
其中x1,x2,x3表示3个因素;x1x2,x1x3,x2x3表示 交互作用 若不考虑交互作用,为三元一次线形回归方程: y=a+b1x1+b2x2+b3x3
-1 -1 1
-0.480 0.480 -0.472 -0.472 0.516 -0.532
-0.480 0.480 -0.472 -0.472 -0.516 -0.516 -0.532 0.532 0.448 0.484 0.038 -0.448 0.484 0.058