正交试验结果分析的回归分析方法

正交试验结果分析的回归分析方法
正交试验结果分析的回归分析方法

正交试验结果分析的回归分析方法

方法简述

本节的题目表明,本方法仅仅是对正交试验结果进行分析的一种方法。在对正交试验结果进行分析之前,如何明确试验指标、因素和水平,如何选择正交表,如何进行表头设计,如何做实验等,与本章所讲的常规的正交试验设计方法是完全相同的。本方法实际上是用正交表来设计试验方案,再用逐步回归方法来处理正交试验的实验数据。用正交表来设计试验方案,目的是使数据点的分布均匀合理;用逐步回归方法来处理实验数据,目的是为了得到有多种用途的数学回归式。

回归模型和回归方法

正交试验设计方法特别适合于解决多因素试验问题。化工上,大多数的实际问题都是多因素的问题,而且多数问题都是非线性的问题。一个适用于多元线性和非线性回归的回归模型,是下式所示的多元二次多项式:(以4个自变量为例)

(4-7)

可见,在4个自变量时,若包括b0则待求的回归系数就多达15个。为此实验的次数至少应16次,而且求回归系数的过程和应用回归式求y的计算过程都很长,舍入误差较大。实际上,如同在方差分析时有些列在F检验中会不显著一样,在按式(4-7)进行回归分析时有些项在F检验中也会不显著。若只让F检验显著的项进入和保留在回归式中,则所得的回归式肯定会比式(4-7)简化许多。为此,我们推荐使用逐步回归方法来进行多元二次多项式的回归。

逐步回归方法见本书的第3章3.5.5。在这种回归方法中,用每次选入时至多选入一项,每次剔除时至多剔除一项,选入、剔除交替进行的办法来进行回归操作。该选入时,从当前尚在回归式之外的众“项”中选择F值最大且F检验显著的一项,送入回归式。该剔除时,从当前已在回归式之中的众“项”中选择F值最小且F检验不显著的一项,从回归式剔除出去。由此可知,在最后所得的回归式中,每一项回归系数的F检验都是显著的。

上面说到每次选入时至多选入一项,其中的“项”指的是式(4-7)中用“+”隔开的项,如x3, 或x1x2,或等,选择正交表时即使不考虑交互作用x2×x3,进行回归分析最后所得的回归式中也可能含有x2x3一项。一旦出现了x2x3项,就表示交互作用“x2×x3”存在且应该考虑。因此用回归分析方法对正交试验结果进行分析的一个优点是:安排试验方案时因不考虑交互作用而选择较小的正交表,并不影响后来通过回归分析将客观存在着的交互作用找出。

用回归分析方法分析正交试验结果时,可以引出的结论。

用逐步回归方法来回归正交试验的数据时不仅得到一个回归式,而且也能像极差、方差分析那样引出一些结论。

①关于各项的显著性问题。由逐步回归方法的原理可知,凡是在最后所得的回归式中被选入并且被保留下来的“项”,都是在F检验中显著的项。凡是没有在最后的回归式中出现的项,就是未被选入或者选入后又被剔除的项,就是在F检验中不显著的项。

②关于因素间交互作用问题。凡是在回归式出现的两个因素(自变量)相乘的项,都是必须考虑的交互作用。反之,凡是在回归过程中虽然已考虑了出现某两因素相乘的可能性,但最后并没有在回归式中出现的两个因素相乘的项,都可以认为该交互作用不存在。

③若需要分析回归式中各项对因变量y影响的大小时,可以按下述方法进行。假设因素数为4的某试验问题逐步回归最后得到的回归式为:

(4-8)

则可令

(4-9) 将上式变为

在式(4-9)中,X1、X2、X3、X4 4项,谁是主要矛盾?直接比较实际回归系数b1、b2、b3、b4、的大小,行吗?不行。因为实际回归系数b1~ b4的数值与X1、X2、X3、X4和y的单位有关。为消除单位的影响,宜比较“标准回归系数”的绝对值的大小。标准回归系数的定义式如下:

(4-10) 式中:

(4-11)

(4-12)

(4-13)

(4-14) ……

标准回归系数的绝对值愈大,该项对因变量y值的影响愈大。

④试验指标随各因素的变化趋势和适宜条件的确定。

有了回归式之后,各种情况下的y值均可求出,按理说这个问题是不成问题的。实际上的困难在于在有一个或多个交互作用的情况下,y随某因素的变化规律会受到另一个或几个因素数值的影响,该用什么情况下的变化规律作为代表来说明所要说明的问题,并且应力求使变化趋势的讨论,有助于下一步最适宜操作条件的确定,此时,情况变得十分复杂。分析过程较繁琐,而最终引出的结果与用方差分析法得到的结论是一致的,所以用方差分析法确定最适宜操作条件将更为简便。用逐步回归法最大的特点是能得到回归式,更有利于试验结果的推广应用。

正交试验设计的spss分析

上机操作6:正交试验设计的spss分析习题:有一混合水平的正交试验,A因素为葡萄品种,A1、A2、A3、A4,B因素为施肥期,有B1、B2,C因素为施肥量,有C1、C2,重复三次,采用L8(4×24)正交表,试验结果如下表,试进行分析 葡萄品种施肥时期及用量实验结果 解: 1.定义变量,输入数据:在变量视图中写入变量名称“产量”、“区组”、“施肥量”、“施肥期”、“品种”“处理”,宽度均为8,小数均为0。并在数据视图依次输入变量。 2.分析过程: (1)正态分布检验: 工具栏“图形”——“P-P图”,在“变量”中放入“产量”,“检验分布”为“正态”,“确定”。 (2)方差齐性检验: a.工具栏“分析”——“比较均值”——“单因素ANOVA”。 b.在“因变量”中放入“产量”,在“固定因子”中放入“品种”。 c.点击“选项”,在“统计量”中点击“方差同质性检验”,“继续”。 d.“确定”。工具栏“分析”——“比较均值”——“单因

素ANOVA”。 e.在“因变量”中放入“产量”,在“固定因子”中放入“施肥期”。 f.点击“选项”,在“统计量”中点击“方差同质性检验”,“继续”。 g.“确定”。在“因变量”中放入“产量”,在“固定因子”中放入“施肥量”。 h.点击“选项”,在“统计量”中点击“方差同质性检验”,“继续”。 i.“确定”。在“因变量”中放入“产量”,在“固定因子”中放入“处理”。点击“选项”,在“统计量”中点击“描述性”和“方差同质性检验”,“继续”。 j.“确定”。 (3)显著性差异检验: a.工具栏“分析”——“常规线性模型”——“单变量”。 b.在“因变量”中放入“产量”,在“固定因子”中分别放入“施肥期”、“施肥量”、“品种”“区组”。 c.点击“模型”,“定制”,将“施肥期”、“施肥量”、“品种”、“区组”放入“模型”下。在“建立项”中选择“主效应”,“继续”。 d.点击“两两比较”,将“施肥期”、“施肥量”、“品种”放入“两两比较检验”中,点击“假定方差齐性”中的“Duncan”。

回归正交试验设计

回归正交试验设计 一、概述 (1)回归分析与正交试验设计的主要优缺点 回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。 正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。 (2)回归正交试验设计 回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。 根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。

二、一次回归正交试验设计 (一)一次回归正交试验设计的概念 一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。当只研究一个因素时,其线性回归模型: y =β0+β1z +e (1) 其回归方程为: z y ∧ ∧ ∧ +=10ββ (2) 式中∧ 0β、∧ 1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2 )的随机变量。可以证明,∧0β、∧1β和∧ y 是β0、β1和y 的无偏估计,即 E(∧0β)=β0,E(∧1β)=β1,E(∧ y )=y 一次回归正交试验设计是通过编码公式x =f(z) ?? 即变量变换,将式(2)变为: b b y 10+=∧ (3) 且使试验方案具有正交性,即使得编码因素X的各水平之和为零: ∑==m i i x 1 (4) 式中m 是因素x 的水平数。 在回归分析中,回归系数的计算公式为:

二次回归正交试验

二次回归正交试验 为了检测某种原料的吸水倍率,重点考察氮肥含量和催化剂对试验指标的影响,已知氮肥含量(x1)的变化范围为0.7~0.9,催化剂(x2)的变化范围为1~3 mL,用二次正交组合设计分析出这两个因素与试验指标(y)之间的关系。 (1)因素水平编码 计算依据 m=2,取m0=2,根据星号臂γ计算公式或查表得γ=1.078 X(1γ)=0.9 ,x(-1γ)=0.7, x(10)=0.8 Δ1=(0.9-0.8)/1.078=0.093 X(2γ)=3 ,x(-1γ)=1, x(10)=2 Δ2=(3-2)/1.078=0.93

(2)试验方案 借助excel分析如下:

①回归方程显著性检验:F=186.5564,, ,12.4)74(95.0=F 因此回归方程非常显著。 '74.41'37.2375.656.2609.952.468y 212121z z z z z z ----+= ②偏回归系数的显著性检验 9 .496.113305.113806.113308.47058.14583.1822.44615.5528.4705701.274.41)(8.1458701.224.23)(3.182475.6)(2 .4461324.656.265.552324.609.95.113801046852206303)(122111221221222222221 121111221 21212 1222 1222222 112112212 1 =-=-==++++=++++==?===?===?===?===?===-=-=∑∑∑∑∑∑∑=======R T e R n i i n i i n i n i i n i i n i i n i i T SS SS SS SS SS SS SS SS SS z b SS z b SS z z b SS z b SS z b SS y n y SS 方差分析: dfT=n-1=10-1=9 df1=df2=df12=df1’=df2’=1

正交实验结果如何进行数据分析57070

正交实验如何数据分析 我们把在试验中考察的有关影响试验指标的条件称为因素(也叫因子),把在试验中准备考察的各种因索的不同状态(或配方)称为水平。在研究比较复杂的工程问题中,往往都包含着多个因素,而且每个因素要取多个水平。 对于包含五个因素、五个水平的工程项目,理论计算必须进行55=3125次试验。显然,所需要的试验次数太多了,工作量太大。实践告诉我们,合理安排试验和科学分析试验,是试验工作成败的关键。 试验方案设计的好,试验次数就少,周期也短,这样不仅节省了大量人力、物力、财力和时间,而且可以得到理想的结果。相反,如果试验设计安排的不好,即使进行了很多次试验,浪费了大量材料、人力和时间,也不一定能够得到预期的结果。 正交试验法,就是在多因素优化试验中,利用数理统计学与正交性原理,从大量的试验点中挑选有代表性和典型性的试验点,应用“正交表”科学合理地安排试验,从而用尽量少的试验得到最优的试验结果的一种试验设计方法。 正交试验法也叫正交试验设计法,它是用“正交表”来安排和分析多因素问题试验的一种数理统计方法。这种方法的优点是试验次数少,效果好,方法筒单,使用方便,效率高。 由于试验次数大大减少,使得试验数据处理非常重要。我们可以从所有的试验数据中找到最优的一个数据,当然,这个数据肯定不是最佳匹配数据,但是肯定是最接近最佳的了。

用正交表安排的试验具有均衡分散和整齐可比的特点。均衡分散,是指用正交表挑选出来的各因素和各水平组合在全部水平组合中的分布是均衡的。整齐可比是说每一因素的各水平间具有可比性。 最简单的正交表L4(23)如表-1所示。 表-1 记号L4(23)的含意如下: “L”代表正交表; L下角的数字“4”表示有4横行(简称为行),即要做四次试验; 括号内的指数“3”表示有3纵列(简称为列),即最多允许安排的因素个数是3个; 括号内的数“2”表示表的主要部分只有2种数字,即因素有两种水平l与2,称之为l水平与2水平。 表L4(23)之所以称为正交表是因为它有两个特点: 1、每一列中,每一因素的每个水平,在试验总次数中出现的次数

一次回归正交设计

第五讲回归设计及统计分析 设目标性状y与z1、z2……z m等因素有关,我们可以应用回归分析的方法建立y与诸因素的回归方程,以此对y进行预测和控制,或筛选y的最优指标。z1、z2……z m构成一个因子空间,每一组z1、z2……z m值对应一个y值。如何在因子空间中选择最适当的试验点,以最少的试验点寻求y的最优区域,这就要将回归分析与正交设计结合起来应用,称为回归正交设计。按回归模型的次数,回归正交设计又分为一次回归正交设计和二次回归正交设计。 一、一次回归正交设计 一次回归正交设计主要是应用2水平正交表进行设计,其设计和分析步骤如下。 1.确定试验因素的变化范围

例如研究m 个栽培因素z 1、z 2……z m 与作物产量y 的数量关系,首先需确定各个栽培因素的变化范围。设因素z j 的变化区间为(z 1j ,z 2j ),则z 1j 和z 2j 分别为因素z j 的下水平和上水平。那么 1202j j j z z z += 为因素z j 的零水平。 212j j j z z ?=- 为因素z j 的变化区间。 2.对各因素的水平编码 编码就是对各个因素的取值作如下线性变换: 0j j j j z z x =?-

式中x j 为编码值。如: 101211212 12j j j j j j j j j z z z z z x z z =?-+--==- 0000j j j j z z x =?-= 201222212 12j j j j j j j j j z z z z z x z z =?+--==- 这样就建立了z j 与x j 的一一对应关系: 下水平 z 1j x 1j (-1)

正交实验设计及结果分析

正交试验设计对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察3 个或3 个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 1 正交试验设计的概念及原理 1.1 正交试验设计的基本概念 正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。 例如:设计一个三因素、3 水平的试验 A 因素,设A、A?、A33个水平;B因素,设B、B2、B33个水平; C因素,设G、G、G 3个水平,各因素的水平之间全部可能组合有27 种。 全面试验:可以分析各因素的效应,交互作用,也可选出最优水平组合。但全面试验包含的水平组合数较多(图示的27 个节点),工作量大,在有些情况下无法完成。 若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。 全面试验法示意图

三因素、三水平全面试验方案 正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正因为正交试验是用部分试验来代替全面试验的,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交试验设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。 如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包

一次回归正交设计例子

一次回归正交设计 某冶炼厂排出的废水中含有大量的镉、鉮、铅等有害元素,对环境造成严重污染。考察的试验因素为温度(x1)、碱与硫酸亚铁之比(x2)以及硫酸亚铁用量(x3)对指标除镉效率(y)的影响。不考虑交互作用。已知x l=60~80℃,x2=8~12,x3=1~3ml。 (1)因素水平编码及试验方案的确定 表1 因素水平编码表 编码z j温度(x1) 碱与硫酸亚铁之比 (x2)硫酸亚铁用量 (x3) -1 60 8 1 0 70 10 2 1 80 1 2 3 △j 10 2 1 由于不考虑交互作用,所以建立一个三元线性方程。因素水平编码如表1所示。选正交表L8(27)安排试验,将三个因素分别安排在回归正交表的第1、2、4列,试验方案及试验结果见表2,表中的第9、 10、11号试验为零水平试验。 表2 试验方案及试验结果 试验 号z1 z2 z3 温度(x1) 碱与硫酸亚 铁之比(x2) 硫酸亚铁用 量(x3) 除镉效率 y/% 1 1 1 1 80 1 2 3 8.0 2 1 1 -1 80 12 1 7. 3

3 1 -1 1 80 8 3 6. 9 4 l -1 -l 80 8 l 6.4 5 -1 1 1 60 12 3 6.9 6 -1 1 -1 60 12 1 6.5 7 -1 -1 l 60 8 3 6.0 8 -1 -1 -1 60 8 1 5.1 9 0 0 0 70 10 2 6.6 10 0 0 0 70 10 2 6.5 11 0 0 0 70 10 2 6.6 ⑵回归方程的建立 表3试验结果及计算表 提取率y y2 z1y z2y z3y 试验号z1 z2 z3 /% 1 1 1 1 8.0 64.00 8.0 8.0 8.0 2 1 1 -1 7. 3 53.29 7.3 7.3 -7.3 3 l -1 1 6.9 47.61 6.9 -6.9 6.9 4 1 -1 -1 6.4 40.96 6.4 -6.4 -6.4 5-1 1 1 6.9 47.61 -6.9 6.9 6.9 6 -1 1 -1 6.5 42.25 -6.5 6.5 -6.5 7 -1 -1 1 6.0 36.00 -6.0 -6.0 6.0 8 -1 -1 -1 5.1 26.01 -5.1 -5.1 -5.1

正交实验设计与结果分析

正交试验设计 对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 1 正交试验设计的概念及原理 1.1 正交试验设计的基本概念 正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。 例如:设计一个三因素、3水平的试验 A因素,设A1、A2、A33个水平;B因素,设B1、B2、B33个水平;C因素,设C1、C2、C3 3个水平,各因素的水平之间全部可能组合有27种。 全面试验:可以分析各因素的效应,交互作用,也可选出最优水平组合。但全面试验包含的水平组合数较多(图示的27个节点),工作量大,在有些情况下无法完成。 若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。 全面试验法示意图

三因素、三水平全面试验方案 正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正因为正交试验是用部分试验来代替全面试验的,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交试验设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。 如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。 例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。 正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计 某产品的产量与时间、温度、压力和溶液浓度有关。实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在 20%~40%,考察Z 1~Z 2 的一级交互作用。 因素编码 Z j (x j ) Z 1 /min Z 2 /o C Z 3 /*105Pa Z 4 /% 下水平Z 1j (-1)30 50 2 20 上水平Z 2j (+1)40 60 6 40 零水平Z 0j (0)35 55 4 30 变化间距 5 5 2 10 编码公式X 1=(Z 1 -35)/5 X 2 =(Z 2 -55)/5 X 3 =(Z 3 -4)/2 X 4 =(Z 4 -30)/10 选择L8(27)正交表 因素x 1,x 1 ,x 3 ,x 4 依次安排在第1、2、4、7列,交互项安排在第3列。 试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi 1 1 1 1 1 1 1 9.7 2 1 1 1 -1 -1 1 4.6 3 1 1 -1 1 -1 -1 10.0 4 1 1 -1 -1 1 -1 11.0 5 1 -1 1 1 -1 -1 9.0 6 1 -1 1 -1 1 -1 10.0 7 1 -1 -1 1 1 1 7.3 8 1 -1 -1 -1 -1 1 2.4 9 1 0 0 0 0 0 7.9 10 1 0 0 0 0 0 8.1 11 1 0 0 0 0 0 7.4 Bj=∑ xjy 87.4 6.6 2.6 8.0 12.0 -16.0 aj=∑ xj2 11 8 8 8 8 8 bj = Bj /aj 7.945 0.825 0.325 1.000 1.500 -2.00 Qj = Bj2 /aj 393 5.445 0.845 8.000 18.000 32.000 可建立如下的回归方程。 Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2 显著性检验: 1、回归系数检验

回归试验设计作业

1、研究氮(N )、磷(52O P )、钾(O K 2)对玉米产量的影响。已知施氮、磷、钾肥的下限和上限依次为:氮,0 和17kg/亩;磷,0 和7kg/亩、钾,0 和18kg/亩. 试用二次回归正交设计方法写出它们的因素编码表并制定试验方案。 2、为提高钻头的寿命,在数控机床上进行试验,考察钻头的寿命与钻头轴向振动频率F 及振幅A 的关系。在试验中,F 与A 的变动范围分别为:[125 Hz ,375Hz]与[1.5,5.5],试写出因素水平编码表并利用二次回归正交旋转组合设计安排试验,并写出参与运算的数据结构矩阵。 3、国内民用剪生产一直是沿袭千百年的传统工艺,近代虽有改进,但绝大多数民用剪的生产工艺仍然存在工序多、工艺流程长、质量不稳定、劳动条件差、生产率低、经济效益少等缺点。在全国民用剪生产新工艺的研究中,某厂确定了最佳工艺参数试验因素及取值范围如下:1z 剪刀运行速度[230,370];2z 感应器与剪刀的距离[5.18,10.82];3z 屏极电流[1.24, 1.68],应用二次回归旋转设计写出因素水平编码表和设计方案。 4、应用二次回归旋转设计寻求有害废水净化的最佳工艺条件。 某冶练厂排出的废水中含有大量的镉、砷、铅等有害元素,对环境造成污染。务了保护环境,消除污染,该厂在铁氧体净化废水工艺中应用正交试验设计和二次回归旋转设计。根据废水净化工艺的需要,进行了三指标四因素试验:考察的试验指标为:镉、砷、铅的净化率,试验因素为温度1z (34~42)、时间2z (30~50)、碱与硫酸亚铁之比(1.34~1.46)3z 和硫酸亚铁用量4z (1.5~2.5),给出试验设计方案. 5、利用通用旋转设计寻求镓溶液导电率与因素1z (镓的浓度)和2z (苛性碱浓度)的二次回归试验设计。已知因素试验考察的范围: 1z :L g /70~30, 2z L g /150~90写出因素水平编码表和设计方案。 6、用3GA 、BA 和多菌灵防治苹果腐烂病的试验,各因素的下水平和上水平分别为: 3GA : 0kg mg /和200kg mg /;BA 0kg mg /和 200kg mg /;多菌灵:0%和10%

正交试验结果的极差分析法

正交试验结果的极差分析法 正交试验方法能得到科技工作者的重视,在实践中得到广泛的应用,原因之一是不仅试验的次数减少,而且用相应的方法对试验结果进行分析可以引出许多有价值的结论。因此,在正交试验中,如果不对试验结果进行认真的分析,并明确地引出应该引出的结论,那就失去用正交试验法的意义和价值。 下面以L4(23)表为例讨论正交试验结果的极差分析法。 表4-13 L4 (2 3)正交试验计算表 在表4-13中: I j——第j列“1”水平所对应的试验指标的数值之和。 Ⅱj——第j列“2”水平所对应的试验指标的数值之和。 (第j列有“3”,“4”水平时)

k j——第j列同一水平出现的次数。等于试验的次数(n)除以第j列的水平数。 ——第j列“1”水平所对应的试验指标的平均值。 ——第j列“2”水平所对应的试验指标的平均值。 D j——第j列的极差。等于第j列各水平对应的试验指标平均值中的最大值减最小值,即 用极差法分析正交试验结果应引出以下几个结论: ①在试验范围内,各列对试验指标的影响从大到小的排队。 某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。 所以各列对试验指标的影响从大到小的排队,就是各列极差D的数值从大到小的排队。 ②试验指标随各因素的变化趋势。 ③使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。 ④对所得结论和进一步研究方向的讨论。 例4-5要求对例4-4的试验问题,写出应用正交试验设计方法的全过程,用极差法分析正交实验的结果。 解:试验目的:提高磺化反应的乙酰胺苯的收率。 试验指标:乙酰胺苯的收率 表4-14因素水平表

回归正交试验设计

8 回归正交试验设计 前面介绍的正交试验设计是——种很实用的试验设计方法,它能利用较少的试验次数获得较好的试验结果,但是通过正交设计所得到的优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案;回归分析是一种有效的数据处理方法,通过所确立的回归方程,可以对试验结果进行预测和优化,但回归分析往往只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。如果能将两者的优势统一起来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这正是我们所期望的。回归正交设计(orthogonal regression design)就是这样一种试验设计方法,它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。 8.1 一次回归正交试验设计及结果分析 一次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m 个试验因素x 1,x 2,……,x m ,之间的一元回归方程: $1122m m y a b x b x b x =++++L (8-1) 或者 $1 m j j kj k j j k j y a b x b x x =?=++∑∑ k=1,2,…,m -1(j≠k ) (8-2) 8.1.1 一次回归正交设计的基本方法 (1)确定因素的变化范围 根据试验指标y ,选择需要考察的m 个因素x j (j =1,2,…,m),并确定每个因素的取值范围。设因素x j 的变化范围为[x j1,x j2],分别称x j1和x j2为因素x j 的下水平和上水平,并将它们的算术平均值称作因素x j 的零水平,用x j0。表示。 12j02 j j x x x += (8-3) 上水平与零水平之差称为因素x j 的变化间距,用△j 表示,即: 20j j j x x ?=- (8-4) 或 21 2 j j j x x -?= (8-5) (2)因素水平的编码 编码(coding)是将x j 的各水平进行线性变换,即: j j j x x z j -= ? (8-6) 式(8—6)中z j 就是因素x j 的编码,两者是一一对应的。显然,与x j1,x j0和x j2的编码分别为-1,0和1,即z j1=-1,z j2=0,z j2=1。一般称x j 为自然变量,z j 为规范变量。因素水平的编码结果可表示成表8—1。 对因素x j 的各水平进行编码的目的,是为了使每个因素的每个水平在编码空间是“平等”的,即规范变量z j 的取值范围都在[1,-1]内变化,不会受到自然变量x j 的单位和取值大小的影响。所以编码能将试验结果y 与因素z j (j =1,2,…,m)各水平之间的回归问题,转换成试验结果y 与编码值z j 之间的回归问题,

正交试验结果分析的回归分析方法

正交试验结果分析的回归分析方法 方法简述 本节的题目表明,本方法仅仅是对正交试验结果进行分析的一种方法。在对正交试验结果进行分析之前,如何明确试验指标、因素和水平,如何选择正交表,如何进行表头设计,如何做实验等,与本章所讲的常规的正交试验设计方法是完全相同的。本方法实际上是用正交表来设计试验方案,再用逐步回归方法来处理正交试验的实验数据。用正交表来设计试验方案,目的是使数据点的分布均匀合理;用逐步回归方法来处理实验数据,目的是为了得到有多种用途的数学回归式。 回归模型和回归方法 正交试验设计方法特别适合于解决多因素试验问题。化工上,大多数的实际问题都是多因素的问题,而且多数问题都是非线性的问题。一个适用于多元线性和非线性回归的回归模型,是下式所示的多元二次多项式:(以4个自变量为例) (4-7) 可见,在4个自变量时,若包括b0则待求的回归系数就多达15个。为此实验的次数至少应16次,而且求回归系数的过程和应用回归式求y的计算过程都很长,舍入误差较大。实际上,如同在方差分析时有些列在F检验中会不显著一样,在按式(4-7)进行回归分析时有些项在F检验中也会不显著。若只让F检验显著的项进入和保留在回归式中,则所得的回归式肯定会比式(4-7)简化许多。为此,我们推荐使用逐步回归方法来进行多元二次多项式的回归。 逐步回归方法见本书的第3章3.5.5。在这种回归方法中,用每次选入时至多选入一项,每次剔除时至多剔除一项,选入、剔除交替进行的办法来进行回归操作。该选入时,从当前尚在回归式之外的众“项”中选择F值最大且F检验显著的一项,送入回归式。该剔除时,从当前已在回归式之中的众“项”中选择F值最小且F检验不显著的一项,从回归式剔除出去。由此可知,在最后所得的回归式中,每一项回归系数的F检验都是显著的。

EXCEL和SPSS在回归分析、正交试验设计和判别分析中应用

实验2指导:EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用 实验目的 1. 熟悉EXCEL和SPSS在数据分析中的操作; 2. 使用EXCEL和SPSS进行回归分析、正交试验设计和判别分析。 实验内容 1.一元线性回归分析 例:近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模,数据见data.xls的Sheet1。 1)选择数据区域B2:C11,从“插入”菜单中选择“散点图”。Excel将显示相应 散点图。 2)选择图上的点,右键菜单,选择添加趋势线,如下图所示: 3)在趋势线选项,将“显示公式”和“显示R平方”选项打勾,如下图:

结果不仅显示散点图的趋势线,还会显示相应公式,即一元线性回归的回归函数,同时显示R平方值,R即相关系数,其绝对值越接近1,表示两组数据的线性相关程度越高。一元线性回归函数描述了两组数据间存在的线性关系,在上述例子中只要知道其它高校的人数即可根据该公式预测大概的季度销售额。而R 的大小能够用于度量这种预测的准确度。 另外,使用EXCEL自带的函数也能实现一元线性回归: 截距函数INTERCEPT 功能:利用已知的x 值与y 值计算回归直线在y 轴的截距。 语法结构:INTERCEPT(known_y's,known_x's) 斜率函数SLOPE 功能:返回根据known_y‘s 和known_x’s 中的数据点拟合的线性回归直线的斜率。 语法结构:SLOPE(known_y's,known_x's) 相关系数函数RSQ 功能:返回根据known_y‘s 和known_x’s 中数据点计算得出的相关系数的平方。 语法结构:RSQ(known_y's,known_x's) 试比较图表法和函数法计算得出的一元线性回归方程是否一致。 2.多元线性回归分析 例:一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1)和使用面积(x2)建立一个模型,一边对销售价格作出合理的预测。为此收集20栋住宅的房地产评估数据(data.xls的Sheet2)。 由于本问题有两个自变量,因此需要使用多元线性回归,需要借助于Excel 的数据分析功能。 1)点击“数据分析”,跳出回归分析对话框; 2)填充应变量y和自变量x1,x2对应的区域和输出区域,如下图:

正交试验设计方法

第5章 正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢? 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33 =27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数 愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T 表示,下标1、2、3表示因素的不同水平,分别记为T 1、T 2、T 3。 常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试

验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢? 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现m=m2时的实验效果最好(好的用□表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。 固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。 固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2)水平最好是有条件的。在T≠T1,p≠p1时,m2水平不是最好的可能性是有的。②在改变m的三次实验中,固定T=T2,p=p3应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。 所有的正交表与L9(34)正交表一样,都具有以下两个特点: (1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 (2)表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。在表L9(34)中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。

第7章-正交试验设计的极差分析

第7章 正交试验设计的极差分析 正交试验设计和分析方法大致分为二种:一种是极差分析法(又称直观分析法),另一种是方差分析法(又称统计分析法)。本章介绍极差分析法,它简单易懂,实用性强,在工农业生产中广泛应用。 7.1 单指标正交试验设计及其极差分析 极差分析法简称R 法。它包括计算和判断两个步骤,其内容如图7-1所示。 图7-1 R 法示意图 图中,Kj m为第j列因素m 水平所对应的试验指标和,K jm 为Kjm 的平均值。由K jm 的大小可以判断j因素的优水平和各因素的水平组合,即最优组合。R j 为第j 列因素的极差,即第j 列因素各水平下平均指标值的最大值与最小值之差: R j =max(jm j j K K K ,,,21 )-min(jm j j K K K ,,,21 ) R j 反映了第j列因素的水平变动时,试验指标的变动幅度。R j 越大,说明该因素对试验指标的影响越大,因此也就越重要。于是依据

R j的大小,就可以判断因素的主次。 极差分析法的计算与判断,可直接在试验结果分析表上进行,现以例6-2来说明单指标正交试验结果的极差分析方法。 一、确定因素的优水平和最优水平组合 例6-2 为提高山楂原料的利用率,某研究组研究了酶法液化工艺制造山楂精汁。拟通过正交试验寻找酶法液化工艺的最佳工艺条件。 在例6-2中,不考虑因素间的交互作用(因例6-2是四因素三水平试验,故选用L9(34)正交表),表头设计如表6-5所示,试验方案则示于表6-6中。试验结果的极差分析过程,如表7-1所示. 表6-4 因素水平表 表6-6 试验方案及结果

试验指标为液化率,用y i 表示,列于表6-6和表7-1的最后一列。 表7-1 试验方案及结果分析 计算示例: 因素A 的第1水平A1所对应的试验指标之和及其平均值分别为: K A 1=y1+y 2+y3=0+17+24=41,=1A K 3 1 K A1=13.7

正交实验结果如何进行数据分析

正交实验如何数据分析 我们把在试验中考察得有关影响试验指标得条件称为因素(也叫因子),把在试验中准备考察得各种因索得不同状态(或配方)称为水平.在研究比较复杂得工程问题中,往往都包含着多个因素,而且每个因素要取多个水平。 对于包含五个因素、五个水平得工程项目,理论计算必须进行55=3125次试验.显然,所需要得试验次数太多了,工作量太大。实践告诉我们,合理安排试验与科学分析试验,就是试验工作成败得关键。 试验方案设计得好,试验次数就少,周期也短,这样不仅节省了大量人力、物力、财力与时间,而且可以得到理想得结果。相反,如果试验设计安排得不好,即使进行了很多次试验,浪费了大量材料、人力与时间,也不一定能够得到预期得结果. 正交试验法,就就是在多因素优化试验中,利用数理统计学与正交性原理,从大量得试验点中挑选有代表性与典型性得试验点,应用“正交表”科学合理地安排试验,从而用尽量少得试验得到最优得试验结果得一种试验设计方法。 正交试验法也叫正交试验设计法,它就是用“正交表"来安排与分析多因素问题试验得一种数理统计方法。这种方法得优点就是试验次数少,效果好,方法筒单,使用方便,效率高。 由于试验次数大大减少,使得试验数据处理非常重要。我们可以从所有得试验数据中找到最优得一个数据,当然,这个数据肯定不就是最佳匹配数据,但就是肯定就是最接近最佳得了。 用正交表安排得试验具有均衡分散与整齐可比得特点。均衡分散,就是指用正交表挑选出来得各因素与各水平组合在全部水平组合中得分布就是均衡得。整齐可比就是说每一因素得各水平间具有可比性。 最简单得正交表L4(23)如表-1所示。 表-1 记号L4(2)得含意如下: “L”代表正交表; L下角得数字“4"表示有4横行(简称为行),即要做四次试验; 括号内得指数“3”表示有3纵列(简称为列),即最多允许安排得因素个数就是3个; 括号内得数“2"表示表得主要部分只有2种数字,即因素有两种水平l与2,称之为l水平与2水平。 表L4(23)之所以称为正交表就是因为它有两个特点: 1、每一列中,每一因素得每个水平,在试验总次数中出现得次数相等.表-1里不同得水平只有两个——1与2,它们在每一列中各出现2次。 2、任意两个因素列之间,各种水平搭配出现得有序数列(即左边得数放在前,右边得数放在后,按这一次序排出得数对)时,每种数对出现得次数相等。

相关文档
最新文档