DOE试验设计(SAS_JMP)经典学习案例(免费下载)

DOE就在你身边DOE系列之一

DOE，即试验设计(Design Of Experiment)，是研究和处理多因子与响应变量关系的一种科学方法。它通过合理地挑选试验条件，安排试验，并通过对试验数据的分析，从而找出总体最优的改进方案。从上个世纪20年代费雪(Ronald Fisher)在农业试验中首次提出DOE 的概念，到六西格玛管理在世界范围内的蓬勃发展，DOE已经历了80多年的发展历程，在学术界和企业界均获得了崇高的声誉。

然而，由于专业统计分析的复杂性和各行各业的差异性，DOE在很多人眼中逐渐演变为可望而不可及的空中楼阁。其实，DOE绝不是少数统计学家的专属工具，它很容易成为各类工程技术人员的好朋友、好帮手。本文将以一个日常生活中的小案例为线索，结合操作便捷的专业统计分析软件JMP，帮助大家揭开DOE的神秘面纱，了解DOE的执行过程，自由自在地建立属于自我的DOE空间。

场景:相信大家都吃过爆米花，但是大家是否都了解爆米花的制作过程？在品尝爆米花的时候，不知道您是否注意到有很多爆米花没有爆开，也有很多被爆焦。这两种情况都是生产过程中的质量缺陷。

这里，我们基于六西格玛软件JMP来实现我们的目标：寻找使用微波炉加工一包爆玉米花的更佳程序。凭借经验，我们很容易就能确定重要因子的合理范围：加工爆玉米花的时间（介于3至5分钟之间）

微波炉使用的火力（介于5至10档之间）

使用的玉米品牌（A或B）

在爆玉米花时，我们希望所有（或几乎所有）的玉米粒都爆开了，没有（或很少）玉米粒未爆开。因此玉米的"爆开个数"是最终关注的重点。

第1步：定义响应和因子（如图一所示）

图一定义响应和因子

第2步：定义因子约束（如图二所示）

根据经验，你知道：不能在试验中长时间高火力加工爆玉米花，因为这样会烧焦某些玉米粒。不能在试验中短时间低火力加工爆玉米花，因为这样只有少数玉米粒爆开。所以要限制试验，以使加工时间加上微波炉火力小于等于13，但大于等于10。

图二定义因子约束

第3步：添加交互作用项（如图三所示）

我们可以推测：与爆开玉米比例相关的任意因子效应可能取决于某些其它因子的值。例如，品牌A时间变化的效应可能大于或小于使用品牌B相同时间变化的效应。这种因子表现出的协同效应统称为二因子交互作用。我们决定在爆玉米花加工过程的先验模型中纳入所有可能的二因子交互作用。

图三添加交互作用项

第4步：确定试验次数（如图四所示）

根据在模型中添加的效应，执行试验需要一定的试验次数。我们可以使用最小值、建议值，也可以指定试验次数，只要其值大于最小值。本例中，我们将使用默认的试验次数16。

图四确定试验次数

第5步：指定输出表格（如图五所示）

生成的数据表保留了随机化的特性，显示了我们应该运行试验的顺序，首先在7级火力下将第一包B牌的玉米加工3分钟，然后在5级火力下将B牌玉米加工5分钟，依次进行。

图五指定输出表格

第6步：收集和输入数据（如图六所示）

根据设计方案加工爆玉米花。然后，计算每包中爆开的玉米粒的数量。最后，保存结果至数据表。

图六收集和输入数据

第7步：分析结果（如图七所示）

可以构建数据模型了，一般使用最常见的分析方法--最小二乘法，但是如果响应数据明显不呈正态分布时，选择广义线形模型法会显得更为合适。

图七分析结果

简要地查看输出报告中的"参数估计"表，发现所有的p值都小于0.05，表明所有的模型效应，包括一次主因子作用、二次主因子作用和双因子交互作用，均是显着的。

我们已确认时间、火力以及品牌与爆开玉米粒个数之间存在着紧密关系，要进行进一步研究，可以打开"预测刻画器"，分析因子组合的变化如何影响爆开玉米粒的个数。预测刻画器显示了每个因子对响应的预测轨迹，移动红色虚线，便能查看更改因子值对响应产生的影响。例如，单击"时间"图中的红线并左右拖动，当"时间"值从3转移至5时，"爆开个数"也在发生相应得变化。同时，随着时间的增加和减少，时间和火力预测轨迹的斜率也随之改变，表明确实存在时间和火力的交互效应。

最后，还可以通过"预测刻画器"寻找出最优设置，即最合意的设置。我们根据试验分析结果而推荐的方法是：使用A品牌，加工5分钟，并将火力调为6.96级。试验预测在此种设置下加工，产出的玉米粒445个以上都爆开了。

类似这种爆玉米花的案例在我们的生活和工作中还有很多很多，有兴趣的读者完全可以将平时遇到的问题抽象成一个DOE模型，然后借助JMP这样的专业统计分析软件，轻轻松松地得到问题的解决方案。有关DOE的更加深入的理论和应用，笔者会在今后的文章中继续与大家交流。

初识DOE－DOE系列之二

其实，DOE对中国人来说，也不是一个完全崭新的内容。早在新中国成立初期，华罗庚教授就在我国农业、工业领域大力倡导与普及DOE，只是当时他运用的是另一个名词——优选法。七十年代末，方开泰教授和王元院士又提出了著名的“均匀设计”法，这一方法在我国航空航天事业中的导弹设计中取得了巨大成效。与此同时，“均匀设计”法也在全球研究DOE理论的学术界得到了高度赞誉。但是，在将DOE的先进理念和科技方法向各行各业转移，向一般技术人员转移，并转换为高效生产力的道路上，我们的进展还很有限。

通过“DOE系列之一”我们已经知道：DOE与人们的生活及工作密切相关，在专业六西格玛统计分析软件JMP的帮助下，掌握DOE也不再是一件难事。从本质上讲，DOE 是这样一门科学：研究如何以最有效的方式安排试验，通过对试验结果的分析以获取最大信息。所以，DOE有两大技术支柱：试验规划和分析方法。其中，试验规划又可以分为均分设计、因子设计、响应面设计等，分析方法又可以分为极差分析、方差分析、多元回归分析等。虽然DOE的理论体系中涉及统计分析的专业词汇很多，但为便于读者理解，本文包括后续的系列文章将尽量避免过多地涉及统计分析的基本概念，而是将以“解决问题的思路”为导向，由浅入深地向读者介绍DOE的理论体系和应用过程。另外，感谢当代高速发展的计算机技术，我们可以借助六西格玛统计分析软件JMP来实现上述所有的试验设计方案，顺便提一下，JMP是目前唯一能实现上述所有试验设计方案的六西格玛统计分析软件，而且已经面向大中华地区推出中英文双语版软件。

一般的实际问题都是纷繁复杂、千变万化的，但是透过现象看本质，所有实际问题的共同点也可以通过统一的模型来抽象概括。图一就是一个高度简化的过程模型，其中Y1，Y2，…，Ys是我们关心的输出变量，例如质量指标、生产能力和成本等，通常被称为“响应变量”（Response）；X1，X2，…Xk是我们在工作中可以加以控制的输入变量，例如人员、设备、原材料、操作方法和环境等，通常被称为“可控因子”（Factor），它们可以是连续型数据，也可以是离散型数据；中间的“黑匣子”是“过程”（Process），在前两者之间起着衔接转换的作用，它与不同行业、不同产品、不同技术密切相关，但整体都可以用的数学模型来表示。这个数学模型的具体表达式越精准，说明我们对这个过程的理解越深刻，DOE就是协助我们揭示或验证数学模型表达式的利器！

图一过程模型

在某些要求不高的工作环境中，往往不需要用一个复杂的数学表达式来描述过程的全貌，但至少要了解哪个或哪几个因子（X）对响应（Y）的影响显著，哪些因子之间存在着相互影响的关系等。这时，“主因子作用”（Main Effect）和“交互作用”（Interaction）可以帮助我们回答这些问题。在此，不强调具体的计算过程，主要以视觉效果阐述主要概念。主因子作用是指一个因子在不同水平下的变化导致响应的平均变化量。正如图二所示，X在-1和+1两个水平下Y值的落差反映的就是主因子作用。交互作用是指当其他因子的水平改变时，一个因子的主因子作用的平均变化量。正如图三所示，左半部分的因子A对Y的影响没有受因子B的变化而变化，两组A与Y的回归直线完全平行，表明因子A与B之间没有任何交互作用；反之，右半部分的因子A对Y的影响受因子B的变化而变化，两组A与Y的回归直线明显相交，表明因子A与B之间存在显著的交互作用。

图二主因子作用示意图

图三交互作用示意图

表一涡轮叶片厚度试验记录

相关的统计计算可以借助专业六西格玛统计分析软件MP轻松实现，在此不一一详述，重点用形象直观的图形说明分析结果。

图四各因子的主因子作用

图五各因子间的交互作用

由图四可知，铸造温度和浇铸时间对涡轮叶片的厚度有比较显著的影响，而放置时间则几乎没有任何影响。由图五可知，铸造温度与浇铸时间之间、放置时间与浇铸时间之间的交互作用比较明显，而铸造温度与放置时间之间的交互作用则几乎为零。通过上述可视化的分析过程，我们清楚地理解了该过程中铸造温度和浇铸时间的正确设置对最终产品质量的重要性。

当然以上只是有关DOE的一个最基础的应用，笔者会在下期文章中进一步与大家交流更深层次的内容。（资深六西格玛咨询专家周暐）

多因子DOE的魅力－DOE系列之三

通过前两期的介绍，我们已经初步认识到了DOE的强大分析功能。但是有的读者可能会不以为然：在此之前的两个案例中因子的数量太少(只有3个)，而实际需要解决的问题会复杂得多，涉及的因子数量也可能会很多(至少有6个)。因此，他就可能会得出一个结论：DOE只适合于少数因子的问题分析，至于处理多因子问题，则显得无能为力了。

这个结论显然有失偏颇，其实DOE的一大特点就是可以处理包含多达50个(并不限于50个)因子的复杂问题，本期的主要内容就是向读者介绍多因子DOE的方法。

从理论上讲，上一期的DOE案例实质上采用的是完全因子设计(Full Factorial Desig n)，这类方法在因子数量较少的时候实施起来比较方便。但是正如表一所示，当试验中的因子数量逐步增加时，试验次数却呈指数增加，庞大的试验规模意味着巨额的试验费用，意味着实施DOE的可行性越来越小。

因子数量试验次数24

416

532

664

7128

8256

9512

101024

……

表一完全因子DOE的局限

表二3因子的完全因子设计计划表

表三4因子的部分因子设计计划表

聪明的读者一定会猜到还可以使用图二的计划表继续构建出第5、第6乃至第7个因子，但试验的规模依然保留在8次。当然，当同等规模的试验中所涉及的因子数量越多时，产生“混杂”的概率会越大，后期分析结果的精确程度也会有所降低。这就是试验成本与分析精度这对矛盾的平衡，也是“部分因子设计”产生的基本原理。值得一提的是，在制定部分因子设计的具体方案时，不必如此繁琐地逐一推算，成熟的六西格玛统计分析软件JMP 早已能够自动地实现了这一功能。

下面我们想通过一个发生在国外的DOE案例来体会部分因子设计的实际意义。

场景:ACB公司是一家网络公司，主要为个人用户提供服务。近阶段以来公司网站的点击数总体偏低，排名在同行业中持续下滑，高层管理层决定通过一个DOE项目找到少数几个关键因素，提高公司网站的每周访问量。经过初步分析，项目团队发现关键词的个数、关键词的类型、URL标题、每周的更新频率、关键词在标题中的位置和免费礼物是最具可能性的关键因子。但是如果按传统的完全因子设计的思路，至少要做26=64次试验，项目的时间跨度超过一年，分析结果的价值性大大降低，有什么好办法来克服这个困难呢?

显然，这个案例用部分因子设计的DOE来实现是再合适不过了。针对已知的6个关键因子，各取两个最具代表性的水平值，鉴于该项目的主要目的是寻找关键因子，选择筛选效率最高的设计方案26-3(=8)，不同水平组合时分别运行1周，八周后统计相应的点击数量，结果如表四所示。

表四DOE 实施记录接着，专业六西格玛统计分析软件JMP

可以帮助我们做出具体的定性和定量的分析，不仅如此，它还等借助丰富生动的图形甚至动画将分析结果展现给我们。在此笔者

不想强调过多的统计概念，只想用形象直观的图形说明分析结果。

图一主因子作用的Pareto 图

图二主因子作用的正态性图URL 标题

关键词的个数关键词的类型每周的更新频率关键词在标题中的位置免费礼物点击数短

5旧4第70个字符有5083长

5旧1第40个字符有2272短

10旧1第70个字符无2012长

10旧4第40个字符无4328短

5新4第40个字符无6359长

5新1第70个字符无3676短

10新1第40个字符有4779长10新4第70个字符有6549

无论是从图一的Pareto图，还是从图二的正态性图，我们都能清晰地发现每周的更新频率和关键词的类型是影响点击数的关键因子。由此可见，在部分因子设计的思想指引下，多因子试验的时间成本、经济成本大大减少，而主要的分析目的没有受到丝毫的影响，多因子DOE的魅力正吸引着更多的工作人员将DOE的分析方法应用到更多的应用领域中。

用DOE方法最优化质量因子配置－DOE系列之四

经过筛选试验的精简和全因子试验的描述，很多人会满足已经取得的成绩，但也有一些精益求精的人会提出这样的问题：现有的最佳因子水平组合一定是所有因子设置中最理想的选择吗？如果不是，又应当如何找出最优化的因子设置？确实，以往的DOE侧重于分析哪些因子是重要的，到底有多重要以及它们之间是否会相互影响，却没有刻意去从整体中寻觅最佳的因子设置。为了解决这个问题，需要引入DOE中另一种新方法——响应曲面方法（Response Surface Methodology,即RSM），这也是我们本期DOE系列介绍的主题。在这里，笔者仍将借助目前业界公认的高端六西格玛统计分析软件JMP来为大家展现响应曲面方法的实现和应用，顺便提及，JMP6是迄今业界唯一的中英文双语版六西格玛软件，来自全球顶尖的统计学软件集团SAS。

在实际工作中，常常需要研究响应变量究竟如何依赖于自变量X的，进而能找到自变量的设置使得响应变量得到最佳值。当自变量的个数较少（通常不超过4个），则响应曲面方法是最值得推荐的方法，适合于要求响应变量望大（即越大越好）、望小（即越小越好）和望目（即越接近目标值越好）等各种常见情形。

通常来说，DOE的核心技术可分为试验计划和数据分析两大类，响应曲面方法也不例外。在数据分析方面，它和以前介绍的方法没有什么本质的不同，但在试验计划方面，则有显著的改进。响应曲面方法的试验计划主要有中心复合设计和Box-Behnken设计两种形式，具体用图形说明如下。

图一三因子中心复合设计布点示意图

图一是以三维空间立方体的形式展示了一个三个因子的中心复合设计的试验计划示意图，在以下的叙述中给出的坐标都已将各因子代码化。整个试验由下面三部分试验点构成。 1.立方体点（Cube Point），用蓝色点表示。各点坐标皆为1或-1，这是全因子试验相同的部分。2.中心点(Center Point)，用绿色点表示。各点的三维坐标皆为0。3.轴点(Axial（旋转性指数）外，其余维度的自变量坐标皆为0。αPoint)，用黄色点表示。除了一维自变量坐标为±在三个因子情况下，共有6个轴点。试验计划的另一种形式就是Box-Behnken设计。这种设计的特点是将因子各试验点取在立方体每条边的中点上。

图二三因子Box-Behnken设计布点示意图

这时候，将传统的因子设计方法搁置一旁，适时地调用响应曲面方法，往往会起到最佳的效果。为了提高我们应用DOE的工作效率，本文将直接使用专业统计软件JMP进行响应曲面方法分析，试图获得化学试剂的不纯度最低时的配置比例。

首先，我们根据实际情况，以中心复合设计为原则，迅速地确定了13次运行次数的试验规模以及每次试验时的因子具体设置。接着，根据既定的试验计划进行实施，并且及时收集每次试验的响应值。将以上结果汇总之后，即可得到如图三所示的JMP文件格式的数据表格。

图三中心复合设计的试验结果汇总表

然后，运用“模型拟合”的操作平台，就可以得到具体详尽的定量分析。遵循我们“强调通俗易懂，淡化统计原理”的一贯原则，我们不多在统计参数上花费笔墨，依然通过形象直观的图形来说明分析结果。在求出精确解之前,我们先观察一下图四所示的等高线图（C ontour Plot）和图五所示的曲面图（Surface Plot）。从两个图中都可以清楚地看到，在原试验范围内确实存在一个最小值。

图四等高线图

图五曲面图

那么这个最小值究竟是多少？它又是在什么条件下产生的呢？进一步借助JMP 自带的模型预测刻画器（Prediction Profiler），如图六所示，我们可以轻轻松松地得到最优化的配置比例：催化剂%=1.410568，稳定剂%=3.282724，这时产生的最低不纯净度% =3.156636。顺便提及，笔者尝试了多种统计分析软件，只发现JMP集成了模拟功能，实在难能可贵。

至此，我们匆匆走过了应用DOE优化流程的探索之路。其实在DOE的优化过程中，还有很多其他实用的知识和技巧，笔者将会在今后的文章中在做深入的介绍。

图六模型的预测刻画器

顾此不失彼的DOE－DOE系列之五

本连载前四个系列已经介绍了几种不同背景、不同要求的情况下，应用DOE的原理和技巧。但细心的读者会发现之前的案例有一个共同的特点（或者称为局限）：数据分析仅限于单个响应变量。在实际工作中，常常会遇到要同时考虑多个响应变量的情况，例如希望断裂强度越大越好，同时希望厚度越小越好；希望质量水平越高越好，但同时希望成本越低越好等等。这类问题与古人所说的有些相像：“鱼与熊掌，能否兼得”？确实，如何同时考虑多项指标是个很复杂的课题。今天我们的任务就是另辟蹊径，设法解决处理多指标问题，使DOE也可以顾此不失彼。DOE方法的实现离不开统计分析软件的支持，高端六西格玛统计分析软件JMP是目前业界最先进的六西格玛工具，其在DOE方面的表现最为优秀，本期案例我们仍以中英文双语版JMP软件作为DOE方案实现的载体。

其实，解决这个问题的关键是能否创建一个新指标，用它来代表所有的旧指标，然后通过优化这个新指标，就可以实现多指标的平衡化最佳，也就是总体最佳了。这个新指标用什么来表示呢？答案是首先将原先的响应变量转化为另一个变量：意愿(Desirability)d，它的建立可以将求任意响应变量达到最优的问题转化为求一个取值范围在0至1之间的单个意愿达到最大的问题。意愿的函数形式可分为三大类，同时根据实际情况，分别确定它们的容许范围，即“下限”（Lower）和“上限”（Upper）。当试验的指标是越大越好，即“望大”型（Maximize）时，可以用图一来描述此时意愿的规律；当试验的指标是越小越好，即“望小”型（Minimize）时，可以用图二来描述此时意愿的规律；当试验的指标是越接近某值越好，即“望目”型（Target）时，可以用图三来描述此时意愿的规律。这三种不同的函数形式反映了三种不同的指标需求，它们的共同特征是d的取值越接近于1表示越结果越令人满意，d的取值越接近于0则表示相反。

此外，一个过程可能有很多响应变量，而且这些响应变量的重要程度对我们来说也可能不尽相同。权重（Weight）w就是用来表示不同响应变量的重要程度的变量，它的默认值为1，取值范围一般从0.1到10，越小说明其越不重要，越大说明其重要性越强。

在单个意愿di及其对应的权重wi的基础上，就能够合成一个综合指标：复合意愿

。它的一般定义公式为：，如果这些单个意愿的权

重全部相等，则上式可以简化为：。复合意愿D就是我们需要创建的一个新指标，有了它，就可以来考虑k个响应变量的同时优化问题了。

图一“望大型”意愿示意图

图二“望小型”意愿示意图

图三“望目型”意愿示意图

在掌握了多变量响应优化的原理之后，再加上专业DOE软件JMP的具体实施，相应的问题就迎刃而解了。遵循理论联系实际的风格，本文继续通过一个工业案例来介绍多指标DOE的实际应用。

场景:在半导体行业中，蚀刻率（Etch）和不均匀性（Ununiformity）都是非常重要的质量指标，它们的表现与生产过程中的间隙（Gap）和功率（Power）这两个因素密切相关（具体信息参见图四）。在以往的DOE研究中，曾分别独立地对Etch和Ununiform ity做过优化，但产生的矛盾是各自所要求的Gap和Power之间的设置差距较大，怎样才能兼顾两种不同效应的表现，找到最合适的输入控制因素的设定呢？

图四某半导体生产流程的输入输出表

显然，此时的半导体技术人员已处于流程的优化阶段，但同时正面临着一个“鱼与熊掌，孰轻孰重”的两难境地，寄希望于普通的DOE理论是于事无补的。而基于复合意愿理论的DOE方法就有了用武之地，使我们“鱼与熊掌，一举兼得”。

首先，根据已掌握的信息，按照中心复合设计的原则，制定12次运行次数的试验规模以及每次试验时的Gap和Power的具体设置。接着，根据既定的试验计划进行实施，并且同时收集每次试验时Etch和Ununiformity的响应值。将以上结果汇总之后，即可得到如图五所示的JMP文件格式的数据表格。

图五中心复合设计的试验结果汇总表

然后，与以往一样，运用JMP软件中的“模型拟合”的操作平台，就可以得到生产过程的量化分析。我们从大量的分析报表中精选了两个直观形象的图形（图六和图七）来具体说明分析结果。

图六为等高线图，平面地二维坐标表示输入变量Gap和Power，而红蓝两色的等高线分别表示输出变量Etch和Ununiformity。红色阴影区域是Etch的“不可行区域”，蓝色阴影区域是Ununiformity的“不可行区域”，中间一带的白色区域是可以同时满足Etch和U nuniformity要求的“可行域”，它为我们指明了Gap和Power的合理设置范围，也可以将它看作能使输出结果最稳健的取值区域。

图六等高线图

图七为预测刻画器，它是一个二维坐标系矩阵。我们可以从中观察到输入变量与输出变量之间的变化规律，各个输出变量与其对应的单个意愿之间的关系，以及各个输入变量对复合意愿的影响。更可以精确地找到理想的因子设置：Gap=1.110417，Power=371.00 27，它们将会形成复合意愿的最大值：D=0.571931，它所对应的实际输出因子的结果是：Etch=1124.607，Ununiformity=103.5209。与实际要求相比较，这样的结果无疑是令人满意的，既能“顾此”，亦能“不失彼”。

图七预测刻画图

别具特色的稳健参数设计—DOE系列之六

之前的五个DOE系列已经系统地介绍了很多经典试验设计的基本原理和使用技巧。但是，DOE是一个理论和实践高度联系的统计科学门类，在不到一百年的发展历程中，企业界不断地向学术界提出新的意见和建议，而学术界也积极响应，推陈出新地向企业界提供了大量理论指导，逐步形成了更多专业化、精细化的DOE应用分支。比如说，稳健参数设计（Robust Parameter Design）（也称健壮设计、鲁棒设计，简称参数设计）就是其中的典型代表，它是一种在研究工程实际问题中很有价值的统计方法。日本的田口玄一（Genichi Taguchi）博士在参数设计方法方面贡献非常突出，他在设计中引进SN比（信噪比）的概念，并以此作为评价参数组合优劣的一种测度，这是很有价值的，以至于很多文献和软件都把稳健参数设计方法称为田口设计（Taguchi Design）。

稳健参数设计最主要的贡献是通过选择可控因子的水平组合来减少一个系统（或产品、过程）对噪声变化的敏感性，从而达到减少此系统性能波动的目的。同样，它的实现也离不开统计分析软件的支持。高端六西格玛统计分析软件JMP是目前业界最先进的六西格玛工具，其在DOE方面的表现最为优秀，在本期案例中我们将继续以中英文双语版J MP软件作为DOE方案实现的载体。

通俗地说，稳健参数设计区别于其它DOE方法最显著的特征是在关注响应平均值改善的同时，更关注其标准差的改善。那么它是如何实现标准差的改善，也就是说，如何使响应变量的变差减小呢？很自然的想法是，通过减小噪声的变差来实现减小响应变量的变差，噪声因子的来源可能有很多类型，例如原材料参数的变化、环境的变化、载荷因子的变化、单元间的差异和耗损降级等等。通常噪声因子是无处不在的，减小噪声的变差往往需要付出较高的经济代价。稳健参数设计则是更好的一种策略选择。这种策略是通过探索可控因子与噪声因子间的相互作用，从而用改变可控因子的水平组合的办法来减小响应变量的变差。因为可控因子通常易于改变，所以稳健参数设计比直接减小噪声变差更经济更方便。

我们可以通过一个简单直观的例子来理解这一点。正如图一所示，可控因子X本身受到噪声的影响而有波动，且响应变量Y与这个可控因子的关系是非线性的，则我们可以选择斜率较小的平坦区域从而使响应变量的变差减小。这样减小变差的方法比直接减小可控因子的噪声波动要便宜得多。一般地说，工程技术人员在系统设计（System Design）选择确定了系统的构造之后，把选择参数的最佳设置以求减少响应变量变差的方法称为参数设计（Parameter Design）；再进一步把如何限定可控因子的噪声波动的方法称为容差设计(Tolerance Design)。

图一稳健参数设计的原理示意图

目前，在稳健参数设计中公认较好的试验与建模的方法是：用乘积表进行位置与散度建模。接下来，我们将会详细说明。

经典DOE-试验设计及实战模拟培训(2天)

经典DOE-试验设计及实战模拟培训 ●课程背景 DOE是一款强大的研发工具，是世界500强企业研发人员必修课程。它是一门科学，是研究如何合理而有效地组织试验，并运用更为科学的分析工具对试验结果的数据进行处理，取得最佳方案的一种方法，它可以把客户的需求转换成我们的设计需求、工艺需求和生产需求，它可以缩短产品的研发周期，帮助研发工程师从最开始就对产品的质量和成本进行最优化设计，而且可把产品工艺和使用因素都考虑周全，从而设计出先天性健壮产品，使新产品尽快投放市场。 DOE也是一种高级质量工具，在日本不懂DOE（试验设计）的工程师只能算是半个工程师。它可以帮助质量、工艺和技术人员识别关键过程变量，完善参数设定，控制参数的调整限度，制定标准操作程序，减小过程的波动，减少转产时间，适应不断变化的客户需求，提高产品的首次合格率，增加产能，缩短过程调试时间，排除制程中的故障，有效获取对过程的理解，改进产品的稳定性，使流程更加稳定。 ●培训对象研发总监、经理、工程师；技术总监、经理、工程师、技术员；质量总监、经理、工程师；产品流程总监、经理、工程师、技术员；以及加强六西格玛绿带、黑带、黑带大师对DOE的认识、理解和运用。 ●培训时间 2天，详细的培训时间安排请参见以下附件： DOE培训计划.xlsx ●课程收获 1、缩短新产品之开发认证周期； 2、解决那些久经未决的“顽固”品质问题； 3、为生产过程选择最合理的工艺参数； 4、寻找问题的根本原因； 5、提高现有产品的产量和质量；

6、为新的或现有生产检测设备选择最合理的参数； 7、掌握DOE的基本概念和原理，深刻理解DOE的逻辑； 8、掌握全因子试验设计、部分因子试验设计、筛选试验设计，响应曲面设计，以及混料试验设计(化工适用，可选)，为产品原料选择最合理的配方； 9、掌握如何应用筛选试验从众多影响因素中筛选找出影响输出的主要因素，以最少的投入换取最大的收益； 10、掌握如何对因子水平优化得到最佳输出，从而使产品质量得以提升，工艺流程最优化； 11、训练科学的、系统的和统计的分析思维习惯； 12、学习科学合理地安排试验，减少试验次数、缩短试验周期，提高经济效益； 13、掌握如何应用MINITAB软件进行试验设计、数据分析、因子优化和输出预测。课程大纲第一节试验设计基础一.波动的理解二.波动的度量三.总体与抽样四.正态分布第二节试验设计介绍一.什么是试验设计二.试验设计的发展过程三.试验设计的运用四.试验练习第三节试验设计逻辑一.基本术语二.试验误差三.统计试验设计四.基本逻辑

DOE 实验设计(免费下载，相当实用)

Design of Experiments （DOE）实验设计

Design of Experiments（DOE）实验设计 1. 定义和介绍实验设计(Design of Experiments)或设计实验(Designed Experiments)是一系列试验及分析方法集,通过有目的地改变一个系统的输入来观察输出的改变情况。图1-1示出一个系统示意图。图1-1中的系统既可以看作是一个产品开发过程，也可以看作是一个生产过程。对于一个生产过程, 一般它是由一些机图1-1 一个系统示意图：Input输入; Output输出; Controllable input factors可控的输入参数 X1,X2,…,Xp; Uncontrollable input factors不可控的输入参数 Z1,Z2,…,Zq。

器、操作方法和操作人员所组成的,把一种输入原材料转变(加工)成某种输出产品。这种输出产品具有一些可以观察的质量特性,也可叫响应(例如,产量、强度、硬度等)。一些过程参数（X1,X2,…,Xp）是可控的, 例如进给速度、淬火温度等; 而另一些（Z1,Z2,…,Zq）是不可控的, 它们有时被称为噪声参数,例如环境温度、湿度等。实验设计的目的可能包括: (1)确定哪些参数对响应的影响最大; (2)确定应把有影响的参数设定在什么水平，以使响应达到或尽可能靠近希望值(On target)； (3)确定应把有影响的参数设定在什么水平，以使响应的分散度(或方差)尽可能减小。 (4)确定应把有影响的参数设定在什么水平，以使不可控参数（噪声参数）对响应的影响尽可能减小。因此, 在制造过程的开发以及解决过程中出现的问题中都可以应用实验设计,以改善过程的性能,或者使过程对于外部波动源(干涉)不那么敏感，即得到一个“稳健”(Robust)的过程，同时还可节省时间和降低成本。所以,实验设计对于开发和改善制造过程,提高产品质量是一个非常重要的工程工具。除此之处,实验设计还可以在新产品开发或现有产品改进中起到很大作用: (1)评价和比较不同设计方案; (2)评价代用材料; (3)确定影响性能的关键产品设计参数(KPC)。在这些领域应用实验设计可以改善产品的制造工艺性、增强服役性能和可靠性、降低产品成本和缩短产品开发周期。

DOE(试验设计)简介

DOE（Design of Experiment,试验设计）目录 [隐藏] ? 1 什么是DOE ? 2 为什么需要DOE ? 3 DOE的基本原理 ? 4 DOE实验的基本策略 ? 5 DOE的步骤 ? 6 DOE的作用 ?7 DOE的方法 ?8 参考文献 [编辑] 什么是DOE DOE（Design of Experiment）试验设计，一种安排实验和分析实验数据的数理统计方法；试验设计主要对试验进行合理安排，以较小的试验规模(试验次数)、较短的试验周期和较低的试验成本，获得理想的试验结果以及得出科学的结论。试验设计源于1920年代研究育种的科学家Dr.Fisher的研究, Dr. Fisher是大家一致公认的此方法策略的创始者, 但后续努力集其大成, 而使DOE在工业界得以普及且发扬光大者, 则非Dr. Taguchi (田口玄一博士) 莫属。 [编辑] ?要为原料选择最合理的配方时（原料及其含量）； ?要对生产过程选择最合理的工艺参数时； ?要解决那些久经未决的“顽固”品质问题时； ?要缩短新产品之开发周期时； ?要提高现有产品的产量和质量时； ?要为新或现有生产设备或检测设备选择最合理的参数时等。另一方面，过程通过数据表现出来的变异，实际上来源于二部分：一部分来源于过程本身的变异，一部分来源于测量过程中产生的变差，如何知道过程表现出来的变异有多接近过程本身真实的变异呢？这就需要进行MSA测量系统分析。 [编辑]

试验设计的三个基本原理是重复，随机化，以及区组化。所谓重复，意思是基本试验的重复进行。重复有两条重要的性质。第一，允许试验者得到试验误差的一个估计量。这个误差的估计量成为确定数据的观察差是否是统计上的试验差的基本度量单位。第二，如果样本均值用作为试验中一个因素的效应的估计量，则重复允许试验者求得这一效应的更为精确的估计量。如s 2是数据的方差，而有n次重复，则样本均值的方差是。这一点的实际含义是，如果n=1，如果2个处理的y 1 = 145，和y 2 = 147，这时我们可能不能作出2个处理之间有没有差异的推断，也就是说，观察差147-145=2可能是试验误差的结果。但如果n合理的大，试验误差足够小，则当我们观察得y1随机化是试验设计使用统计方法的基石。所谓随机化，是指试验材料的分配和试验的各个试验进行的次序，都是随机地确定的。统计方法要求观察值（或误差）是独立分布的随机变量。随机化通常能使这一假定有效。把试验进行适当的随机化亦有助于“均匀”可能出现的外来因素的效应。区组化是用来提高试验的精确度的一种方法。一个区组就是试验材料的一个部分，相比于试验材料全体它们本身的性质应该更为类似。区组化牵涉到在每个区组内部对感兴趣的试验条件进行比较。 [编辑] 策略一：筛选主要因子（X型问题化成A型问题）实验成功的标志：在ANOVA分析中出现了1~4个显着因子；这些显着因子的累积贡献率在70%以上。策略二：找出最佳之生产条件（A型问题化成T型问题）实验成功的标志：在第二阶段的实验中主要的误差都是随机因素造成的。因为各因子皆不显着，因此，每一因子之各项水准均可使用,在此情况下岂不是达到了成本低廉且又容易控制之目的。策略三：证实最佳生产条件有再现性。 [编辑] 第一步确定目标我们通过控制图、故障分析、因果分析、失效分析、能力分析等工具的运用，或者是直接实际工作的反映，会得出一些关键的问题点，它反映了某个指标或参数不能满足我们的需求，但是针对这样的问题，我们可能运用一些简单的方法根本就无法解决，这时候我们可能就会想到试验设计。对于运用试验设计解决的问题，我们首先要定义好试验的目的，也就是解决一个什么样的

DOE试验设计(SAS_JMP)经典学习案例(免费下载)

DOE就在你身边DOE系列之一 DOE，即试验设计(Design Of Experiment)，是研究和处理多因子与响应变量关系的一种科学方法。它通过合理地挑选试验条件，安排试验，并通过对试验数据的分析，从而找出总体最优的改进方案。从上个世纪20年代费雪(Ronald Fisher)在农业试验中首次提出DOE 的概念，到六西格玛管理在世界范围内的蓬勃发展，DOE已经历了80多年的发展历程，在学术界和企业界均获得了崇高的声誉。然而，由于专业统计分析的复杂性和各行各业的差异性，DOE在很多人眼中逐渐演变为可望而不可及的空中楼阁。其实，DOE绝不是少数统计学家的专属工具，它很容易成为各类工程技术人员的好朋友、好帮手。本文将以一个日常生活中的小案例为线索，结合操作便捷的专业统计分析软件JMP，帮助大家揭开DOE的神秘面纱，了解DOE的执行过程，自由自在地建立属于自我的DOE空间。场景:相信大家都吃过爆米花，但是大家是否都了解爆米花的制作过程？在品尝爆米花的时候，不知道您是否注意到有很多爆米花没有爆开，也有很多被爆焦。这两种情况都是生产过程中的质量缺陷。这里，我们基于六西格玛软件JMP来实现我们的目标：寻找使用微波炉加工一包爆玉米花的更佳程序。凭借经验，我们很容易就能确定重要因子的合理范围：加工爆玉米花的时间（介于3至5分钟之间）微波炉使用的火力（介于5至10档之间）使用的玉米品牌（A或B）在爆玉米花时，我们希望所有（或几乎所有）的玉米粒都爆开了，没有（或很少）玉米粒未爆开。因此玉米的"爆开个数"是最终关注的重点。第1步：定义响应和因子（如图一所示）图一定义响应和因子第2步：定义因子约束（如图二所示）根据经验，你知道：不能在试验中长时间高火力加工爆玉米花，因为这样会烧焦某些玉米粒。不能在试验中短时间低火力加工爆玉米花，因为这样只有少数玉米粒爆开。所以要限制试验，以使加工时间加上微波炉火力小于等于13，但大于等于10。图二定义因子约束

DOE(Design of Experiment,试验设计)

DOE 出自 MBA智库百科(https://www.360docs.net/doc/7f15193897.html,/) DOE（Design of Experiment,试验设计）目录 [隐藏] ? 1 什么是DOE ? 2 为什么需要DOE ? 3 DOE的基本原理 ? 4 DOE实验的基本策略 ? 5 DOE的步骤 ? 6 DOE的作用 ?7 DOE的方法 [编辑] 什么是DOE DOE（Design of Experiment）试验设计，一种安排实验和分析实验数据的数理统计方法；试验设计主要对试验进行合理安排，以较小的试验规模(试验次数)、较短的试验周期和较低的试验成本，获得理想的试验结果以及得出科学的结论。试验设计源于1920年代研究育种的科学家Dr.Fisher的研究, Dr. Fisher 是大家一致公认的此方法策略的创始者, 但后续努力集其大成, 而使DOE在工业界得以普及且发扬光大者, 则非Dr. Taguchi (田口玄一博士) 莫属。 [编辑] 为什么需要DOE ?要为原料选择最合理的配方时（原料及其含量）； ?要对生产过程选择最合理的工艺参数时； ?要解决那些久经未决的“顽固”品质问题时；

?要缩短新产品之开发周期时； ?要提高现有产品的产量和质量时； ?要为新或现有生产设备或检测设备选择最合理的参数时等。另一方面，过程通过数据表现出来的变异，实际上来源于二部分：一部分来源于过程本身的变异，一部分来源于测量过程中产生的变差，如何知道过程表现出来的变异有多接近过程本身真实的变异呢？这就需要进行MSA测量系统分析。 [编辑] DOE的基本原理试验设计的三个基本原理是重复，随机化，以及区组化。所谓重复，意思是基本试验的重复进行。重复有两条重要的性质。第一，允许试验者得到试验误差的一个估计量。这个误差的估计量成为确定数据的观察差是否是统计上的试验差的基本度量单位。第二，如果样本均值用作为试验中一个因素的效应的估计量，则重复允许试验者求得这一效应的更为精确的估计量。如 s2是数据的方差，而有n次重复，则样本均值的方差是。这一点的实际含义是，如果n=1，如果2个处理的y1 = 145，和y2 = 147，这时我们可能不能作出2个处理之间有没有差异的推断，也就是说，观察差147-145=2可能是试验误差的结果。但如果n合理的大，试验误差足够小，则当我们观察得y1随机化是试验设计使用统计方法的基石。所谓随机化，是指试验材料的分配和试验的各个试验进行的次序，都是随机地确定的。统计方法要求观察值（或误差）是独立分布的随机变量。随机化通常能使这一假定有效。把试验进行适当的随机化亦有助于“均匀”可能出现的外来因素的效应。区组化是用来提高试验的精确度的一种方法。一个区组就是试验材料的一个部分，相比于试验材料全体它们本身的性质应该更为类似。区组化牵涉到在每个区组内部对感兴趣的试验条件进行比较。 [编辑] DOE实验的基本策略策略一：筛选主要因子（X型问题化成A型问题）

DOE试验设计的五大步骤

DOE试验设计的五大步骤无论是在工程技术、质量管理、产品研发等方面，还是在近来热门的六西格玛领域，试验设计DOE都是我们解决问题的好帮手，其应用可以说涵盖了包括机械、电子、化工、汽车、烟草、医药、食品、银行、电信、物流等所有的行业。众所周知，各类高科技公司的产品本身及其制造工艺千差万别，小到英特尔公司生产的CPU芯片，大到乔治亚宇航中心研制的火箭系统。如果说这些产品之间有什么共同点的话，其中之一就是都采用了基于JMP 统计软件的试验设计改进方案。如果除去各行业的专业知识，这些知名企业应用试验设计的步骤也是类似的，基本上可以概括为五大步骤，即试验设计的五步曲。第一步确定问题无论在什么企业中，都可能存在一些质量问题，它可以具体地量化为某个KPI指标不能够达到我们事先规定的要求。针对这样的问题，一些简单的方法很可能无法解决，这时我们就会想到试验设计。对于运用试验设计解决的问题，首先要定义好试验的目的，也就是解决一个什么样的问题，问题的危害（即严重性）如何，是否有充足的理由来应用试验设计，等等。因为试验设计虽然比盲目的试验分析节省了很多资源，但毕竟还是要花费一定的资源才能进行的。特别是对于生产型企业，试验设计的进行必然会打乱原有的生产稳定秩序，所以确定试验目的和试验的可行性是首要的任务。随着试验目标的确定，还必须明确地定义试验的指标和接受的规格，这样试验设计才有推进的方向，试验的成功与否也有检验的度量尺度。第二步流程解析很多人（包括某些领导）常常会有一个误区：那就是只将关注点放在结果上，而忽略了产生结果的那个流程。其实任何一个问题的产生，都有它的原因，特性的欠缺、良率的波动、周期的变化等等都有这个特点。从本质上讲，真正的原因一定存在于产生问题的流程当中。有很多的方式来解析流程，但有一点必须做到，那就是尽可能详尽地列出可能的因素。其实对于流程的剖析和认识，就是我们了解问题的开始，因为并不是每个人都能掌握好我们所关注的问题及其流程的。第三步筛选试验流程解析的输出是使我们能够了解问题的可能因素在哪里，虽然不能确定哪个是重要的，但至少可以确定一个总的方向。但是如果我们逐一仔细调查，对于一些微小的影响因素也进行全面试验分析，无疑形成了一种浪费，而且还可能导致试验的误差。这时，对可能的因素进行筛选就显得十分必要。虽然不需要确认交互作用、高阶效应等专业问题，但需要确认哪个因素的影响是显著的。可以使用一些低分解率的两水平试验或者一系列专门的筛选试验（如下图所示）来完成这个任务，这样的试验成本会尽可能地达到最小。而且，对于这一步任务的完成，可以应用一些历史数据，或者完全可靠的经验理论分析，来减少试验因子。筛选因素的结果，使得我们掌握了影响指标的主要因素，这一步尤为关键。而在现实中，这样的结果却往往是通过纯粹的经验主义，甚至是得过且过、不求甚解的态度得出的。第四步析因试验在筛选试验时不强调因素间的交互作用等影响，但给出了主要的影响因素，这时主要因素的数量不会太多，可以进一步度量因素的主效应和交互作用。析因试验主要选择各因素构造的几何体的顶点来完成（如上图所示）。这样的试验构造，可以帮助我们确定对于指标的影响：是否存在主效应或者哪些主效应是显著的，是否存在交互作用或者哪些交互作用是显著的，试验的最终是通过方差分析来检定这些效应是否显著，同

实验设计(DOE)的七大步骤分析

实验设计(DOE)的七大步骤分析无论在六西格码，还是在工程、科技等方面，试验设计都是我们常用来解决问题的方法，其应用可以说涵盖所有的行业。试验设计最开始是在农林方面的研究，所以我们现在的很多试验设计专用名词都源于此，BLOCK，区组的意思，其原始含义就是田地的四方块，随着研究的深入，逐步应用于、医药、化工等各个领域。试验设计的方法很多，根据具体的问题模型和目的我们可以选择适当的设计方法，如混合设计、曲面设计、裂区设计、田口设计、均匀设计等等。试验设计骈弃了以往单个因子逐步调整的做法，避免了忽视交互作用等方面的问题，从而更加系统有效的解决我们所关注的指标。区别于最初农林方面试验设计应用的是，我们可以在很多的行业中采用渐进的方法来采取试验设计方案，而不期望于一步到位。第一步确定目标我们通过控制图、故障分析、因果分析、失效分析、能力分析等的运用，或者是直接实际的反映，会得出一些关键的问题点，它反映了某个指标或参数不能满足我们的需求，但是针对这样的问题，我们可能运用一些简单的方法根本就无法解决，这时候我们可能就会想到试验设计。对于运用试验设计解决的问题，我们首先要定义好试验的目的，也就是解决一个什么样的问题，问题给我们带来了什么样的危害，是

否有足够的理由支持试验设计方法的运作，我们知道试验设计必须花费较多的资源才能进行，而且对于生产型企业，试验设计的进行会打乱原有的生产稳定次序，所以确定试验目的和试验必要性是首要的任务。随着试验目标的确定，我们还必须定义试验的指标和接受的规格，这样我们的试验才有和试验成功的度量指标。这里的指标和规格是试验目的的延伸和具体化，也就是对问题解决的着眼点，指标的达成就能够意味着问题的解决。? 第二步剖析流程关注流程，是我们应该具备的习惯，就像我们的很多企业做水平对比一样，经常会有一个误区，就是只讲关注点放在利益点上，而忽略了对流程特色的对比，试验设计的展开同样必须建立在流程的深层剖析基础之上。任何一个问题的产生，都有它的原因，事物的好坏、参数的便宜、特性的欠缺等等都有这个特点，而诸多原因一般就存在于产生问题的流程当中。流程的定义非常的关键，过短的流程可能会抛弃掉显着的原因，过长的流程必将导致资源的。我们有很多的方式来展开流程，但有一点必须做到，那就是尽可能详尽的列出可能的因素，详尽的因素来自于对每个步骤地详细分解，确认其输入和输出。其实对于流程的剖析和认识，就是改善人员了解问题的开始，因为并不是每个人都能掌握好我们所关注的问题。这一步的输出，使我们的改善人员能够了解问题的可能因素在哪里，虽然不能确定哪个是重要的，

二水平全因子doe试验设计

试验设计试验设计通过有目的地改变一个过程（或活动）的输入变量（因子），以观察输出变量（响应变量）的相应变化。试验设计是识别关键输入因子的最有效方法。试验设计是帮助我们了解输入因子和响应变量关系的最有效途径。试验设计是建立响应变量与输入因子之间的数学关系模型的方法。试验设计是确定优化输出并减少成本的输入设定值的途径。试验设计是设定公差的科学方法。响应变量：所关注的可测量的输出结果，如良率、强度等。》因子：可控的变量，通过有意义的变动，可确定其对响应变量的影响，温度、时间等。水平：因子的取值或设定。处理：某次实验的整套因子。重复：指在不重新组合实验设定的情况下，连续进行实验并收集数据。复制：意谓每个数据值在重新设定测试组合之后收集。随机化：适当安排实验次序，使每个实施被选出的机会都相等。实验设计步骤 1、— 2、陈述问题（通过实验设计解决的问题是什么） 3、设立目标 4、确定输出变量 5、识别输入因子（可控因子/噪声因子） 6、选定每个因子的水平 7、选择实验设计的类型 8、计划并为实施实验做准备 9、实施实验并记录数据 10、！ 11、分析数据并得出结论 10、必要时进行确认实验。可控（控制）因子是我们在工序的正常操作时能设定维持在期望水平的因子。噪音因子是在正常的操作期间变化的因子，而且我们不能够控制它们：或者我们宁愿不控制它们，因为这么做会很昂贵。全因子实验：组合所有因子和每个所有水平的实验一个因子的主效果定义为一个因子在多水平下的变化导致输出变量的平均变化。参考下表，其中两个因子，浓度与催化剂。输出变量是良率。 # 主效果图能够判定出因子对输出变量影响的大小。主效果图的斜率越大反应出因子对输出变量的影响越大，但不能说明该因子是对输出变量的显著因子。