单因素试验

合集下载

单因素实验设计报告

单因素实验设计报告:因素实验报告设计单因素实验设计举例正交实验单因素实验设计方案篇一:实验报告单因素方差分析5.1、实验步骤: 1(建立数据文件。

定义2个变量:PWK和DCGJSL，分别表示排污口和大肠杆菌数量。

2. 选择菜单“分析?比较均值?单因素”,弹出“单因素方差分析”对话框。

在对话框左侧的变量列表中，选择变量“DCGJSL”进入“因变量”列表框，选择变量“PWK”进入“因子”列表框。

3(单击“确定”按钮，得到输出结果。

结果解读:由以上结果可以看到，观测变量大肠杆菌数量的总离差平方和为460.438;如果仅考虑“排污口”单个因素的影响，则大肠杆菌数量总变差中，排污口可解释的变差为308.188，抽样误差引起的变差为152.250，它们的方差(平均变差)分别为102.729和12.688，相除所得的F统计量的观测值为8.097，对应的概率P值为0.003。

在显著性水平α为0.05的情况下。

由于概率P值小于显著性水平α，则应拒绝零假设，认为不同的排污口对大肠杆菌数量产生了显著影响，它对大肠杆菌数量的影响效应不全为0。

因此，可判断各个排污口的大肠杆菌数量是有差别的。

5.2、实验步骤: 1(建立数据文件。

定义2个变量:Branch和Turnover，分别表示分店和日营业额。

将Branch的值定义为1=第一分店，2=第二分店，3=第三分店，4=第四分店，5=第五分店。

2. 选择菜单“分析?比较均值?单因素”,弹出“单因素方差分析”对话框。

在对话框左侧的变量列表中，选择变量“Turnover”进入“因变量”列表框，选择变量“Branch”进入“因子”列表框。

3(单击“确定”按钮，得到输出结果。

结果解读:由以上结果可以看到，观测变量日营业额的总离差平方和为1187668.733;如果仅考虑“分店”单个因素的影响，则日营业额总变差中，分店可解释的变差为366120.900，抽样误差引起的变差为821547.833，它们的方差(平均变差)分别为91530.225和14937.233，相除所得的F统计量的观测值为6.128，对应的概率P 值近似为0。

单因素实验设计

单因素实验设计单因素实验设计是指在实验中只有一个研究因素，即研究者只分析一个因素对效应指标的作用，但单因素实验设计并不是意味着该实验中只有一个因素与效应指标有关联。

单因素实验设计的主要目标之一就是如何控制混杂因素对研究结果的影响。

常用的控制混杂因素的方法有完全随机设计、随机区组设计和拉丁方设计等。

一、完全随机设计1.概念与特点又称单因素设计或成组设计，是医学科研中最常用的一种研究设计方法，它是将同质的受试对象随机地分配到各处理组进行实验观察，或从不同总体中随机抽样进行对比研究。

该设计适用面广，不受组数的限制，且各组的样本含量可以相等，也可以不相等，但在总体样本量不变的情况下，各组样本量相同时的设计效率最高。

例如：为了研究煤矿粉尘作业环境对尘肺的影响，将18只大鼠随机分到甲、乙、丙3组，每组6只，分别在地面办公楼、煤炭仓库和矿井下染尘，12周后测量大鼠全肺湿重（g），通过评价不同环境下大鼠全肺平均湿重推断煤矿粉尘对作用尘肺的影响，具体的随机分组可以如下实施：第一步：将18只大鼠编号：1，2，3， (18)第二步：可任意设置种子数，但应作为实验档案记录保存（本例设置spss11.0软件的种子数为200）；第三步：用计算机软件一次产生18个随机数，每个随意数对应一只老鼠（本例用spss11.0软件采用均匀分布最大值为18时产成的18个随机数）；第四步：最小的6个随机数对应编号的大鼠为甲组，排序后的第7个至第12个随机数随因编号为乙组，最大的6个随机数对应编号的大鼠为丙组（结果见表1）。

表1 分配结果编号 1 2 3 4 5 6 7 8 93.75 8.75 16.29 11.12 5.49 3.98 13.64 16.71 1.69随机数组别甲乙丙乙乙甲丙丙甲编号10 11 12 13 14 15 16 17 1813.62 16.36 2.12 4.74 11.54 3.98 0.13 17.35 16.38 随机数组别丙丙甲乙乙甲甲丙丙2.随机数的产生方法（1）随机数字表：如附表13（马斌荣，医学统计学，第4版），这是一个由0～9十个数字组成60行25列的数字表。

单因素试验的方差分析——概率论与数理统计(李长青版)

其次, 同一品种下数据表现出来的差异称为试验(随
机)误差, 这是由客观条件的偶然干扰造成, 与因素(品种) 无直接联系.
方差分析正是分析两类误差的有效工具.
本问题只考虑品种一种因素，故是单因素试验，即只有
一个因子，记为 A, 5个不同的品种就是该因子的5个不同的水平，分别记为 A1 , A2 , A3 , A4 , A5 , 由于同一品种在不同的田块上的亩产量不同，故可以认为一个品种的亩产量就是一个母体，在方差分析中，总是假定各母体相互独立地服从同方差的正态分布，即第 j 个品种的亩产量是一个随机变量，它服从正态分布:
nj
ns , 称为总平均,
它是从 s 个总体中抽得的样本的样本均值.
用样本值 xij 与总平均
x 之间的偏差平方和来反映
种子品种代号 (水平)
重复试验序号及作物实测产量 1 128 125 148 2 126 137 132 3 139 125 139 4 130 117 125 5 142 106 151 133 122 139
A1 A2
A3
这里试验的指标是作物产量, 作物是因素, 三种种子品种代表三个不同的水平. 首先,形成数据差异的直接原因是种子的不同品种.因此, 每个品种下产量的均值差异检验是我们的主要任务.这种由因素(种子品种)造成的差异称为条件(系统)误差.
H 0 : 1 2 s 0, H1 : 1 , 2 , , s 不全为零.
(二) 离差平方和分解引入记号
nj
1 xj nj
s
x
i 1
ij
( j 1, 2,
, s) 水平Aj下的样本均值,
称为组内平均(或列平均)

25.单因素试验的方差分析

数学模型
j 与 2 均未知.
14
需要解决的问题
1.检验假设
H0 : 12 s , H1 : 1, 2 , , s不全相等.
2.估计未知参数1, 2 , , s , 2.
15
数学模型的等价形式
s
记n nj ,
j 1
1 n
s j 1
njj.
总平均
水平Aj的效应, 表示水平 Aj下的总体平均值与总平均的差异.
i 1 nj
( Xij X• j )2
i 1
2
～ 2(nj 1).
23
又由于各 Xij 独立, 所以由 2 分布的可加性知
S E
2
～ 2
s
(nj
j 1
1),
即
S
E2～
2
(n
s),
s
其中n nj .
j1
根据 2 分布的性质可以得到，
SE 的自由度为n s; E(SE ) (n s) 2.
铝合金板的厚度
机器Ⅱ 0.257 0.253
机器Ⅲ 0.258 0.264
0.255 0.254
0.259 0.267
0.261
0.262
4
试验指标: 薄板的厚度因素: 机器
水平:不同的三台机器是因素的三个不同的水平. 假定除机器这一因素外, 其他条件相同,
属于单因素试验. 试验目的: 考察各台机器所生产的薄板的厚度有无显著的差异. 即考察机器这一因素对厚度有无显著的影响. 结论: 如果厚度有显著差异，表明机器这一因素对厚度的影响是显著的.
H0 : 1 23 ,
H1 : 1, 2 , 3不全相等.
进一步假设各总体均为正态变量, 且各总体的

单因素试验方差分析(试验数据处理)

SST ( X ij X ) 2
j 1 i 1
r nj
r
nj
SSA ( X j X ) 2
j 1 i 1
n j ( X j X )2
j 1
s
SSA反映了在每个水平下的样本均值与样本总均值的差异，它是由因子A 取不同水平引起的，所以，称SA是因子A的效应（组间）平方和.
单因素试验——在一项试验中只有一个因素改变.
多因素试验——在一项试验中有多个因素在改变.
例1 下表列出了随机选取的、用于计算器的四种类型的电路的响应时间（以毫秒计）. 表1 电路的响应时间类型Ⅰ 类型Ⅱ 类型Ⅲ 类型Ⅳ 19 20 16 18 22 21 15 22 20 33 18 19 18 27 26 试验指标:电路的响应时间因素:电路类型水平: 四种电路类型为因素的四个不同的水平单因素试验试验目的:考察电路类型这一因素对响应时间有无显著的影响.（从哪些值来看是否有影响呢？）
F值 31.10
显著性
934.73
2
6
467.36
**
组内总和
90.17
1024.89
15.03
8
不同的饲料对猪的体重有非常显著的影响。
三、单因素试验方差分析的简化计算
由于方差分析的计算量比较大，所以引入一种离差平方和的简单算法：
令
Ti —Ai 水平时,ni个试验值之和 Qi —Ai 水平时,ni个试验值的平方和 T—n个试验值之和 Q—n个试验值的平方和
r
列平均X i Ti ni
（组内平均值）
X1
X2
...
r i 1
Xr
n n i 其中诸 ni 可以不一样，

单因素试验.

整个试验的均值
r 1 r 令 ni i , （其中 n ni ）称为一般平均值。 n i 1 i 1
i i , 称为因素A的第 i 个水平 Ai 的效应。
显然有：
n n n n 0
i 1 i i i 1 i i i 1 i i
r
r
r
则线性统计模型变成
X ij i ij , j 1, 2,...ni , i 1, 2,...r
于是检验假设： H : ... 0 1 2 r

等价于检验假设： H0 : 1 2 ... r 0
若H0成立，则
可控因素——在影响试验结果的众多因素中，可人为控制的因素。
水平——可控因素所处的各种各种不同的状态。每个水平又称为试验的一个处理。单因素试验——如果在一项试验中只有一个因素改变，其它的可控因素不变，则该类试验称为单因素试验。
引例
例1 （灯丝的配料方案优选）某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡，在每批灯泡中作随机抽样，测量其使用寿命（单位：小时），数据如下：灯泡寿命灯丝甲乙丙
引
言
在工农业生产和科研活动中，我们经常遇到这
样的问题：影响产品产量、质量的因素很多，例如
影响农作物的单位面积产量有品种、施肥种类、施
肥量等许多因素。我们要了解这些因素中哪些因素
对产量有显著影响，就要先做试验，然后对测试结
果进行分析，作出判断。方差分析就是分析测试结
果的一种方法。
基本概念
试验指标——试验结果。
2. X1 , X 2 ,... X r 相互独立，从而各子样也相互独立。

第9.1节单因素试验的方差分析——概率论与数理统计(李长青版)

ES A ( s 1) 2 n j 2 j
j 1
s
由此得
Se 2 E , ns
1 s SA 2 2 E n j j s 1 s 1 j 1
在 H0 为真时, 即 1 2 s 0 时, 有
S A ( s 1) 将从而在 H0 不真时, 比值 S ( n s ) 有偏大的趋势, 其 e
S A ( s 1) . 记为 F, 即 F Se (n s )
则 F 可以作为检验 H0 的统
计量. 将 Se 写成如下分项相加的形式
Se ( xi1 x1 ) 2 ( xi 2 x2 ) 2 ( xis xs ) 2
的影响.
种子品种代号 (水平) 重复试验序号及作物实测产量
1 128 125 148 2 126 137 132 3 139 125 139 4 130 117 125 5 142 106 151 133 122 139
A1 A2
A3
这里试验的指标是作物产量, 作物是因素, 三种种子品种代表三个不同的水平. 首先,形成数据差异的直接原因是种子的不同品种.因此, 每个品种下产量的均值差异检验是我们的主要任务.这种由因素(种子品种)造成的差异称为条件(系
s nj
从而有
Se ( ij j ) ,
2 j 1 i 1
s
nj
S A n j ( j j ) 2
j 1
s
由此知, Se 反映了误差的波动, 称其为误差的偏差平方和(或称为组内平方和), 它集中反映了试验中与因素及其水平无关的全部随机误差. 在 H0 为真时, SA 反映误差的波动, 在 H0 不真时, SA 反映因子A 的不同水

单因素实验设计

单因素试验设计是指只有一个因素（或仅考查一个因素）对试验指标构成影响的试验。

单因素试验设计要求对试验水平进行布局和优化，是一种水平试验设计。

单因素试验设计方法可分为两类：同时试验设计和序贯试验设计。

同时试验设计就是一次给出全部试验水平，一次完成全部试验并得到最佳试验结果，如穷举试验设计。

序贯试验设计要求分批进行试验，后批试验需根据前批试验结果进一步优化后序贯进行，直到获取最佳试验结果，如平分试验设计、黄金分割试验设计。

一、试验范围与试验精度（一）试验范围试验范围指试验水平的范围。

试验设计时需预先确定试验范围，一般采用两种方法：○1经验估计。

可凭经验估计试验范围，并在试验过程中作调整。

○2预先试验。

要求在较大范围内进行探索，通过试验逐步缩小范围。

（二）试验间隔与试验精度试验间隔是指试验水平的间距，试验精度是指试验结果逼近最佳水平的程度。

显然，试验间隔与试验精度是一对矛盾，试验间隔越大，试验精度越低。

在保证试验精度的条件下，试验水平变化而引起的试验结果变动必须显著地超过试验误差。

（三）试验顺序在确定试验顺序时，往往习惯于按照试验水平高低依次做试验。

这样，随着试验的进行，有些因素会发生缓慢变化甚至影响试验结果。

因此，正确的做法是采用随机化方法来确定试验顺序。

在试验工作量较少或者试验准确度要求较低时，也可以采用按水平高低或者选取中间试验点的方法来进行试验排序。

需强调指出，以上不仅对单因素试验设计，而且对所有试验设计方法都适用。

二、单因素试验设计（一）平分试验设计平分试验设计就是平分试验范围，把其中间点作为新试验点，然后不断缩小试验范围直到找到最佳条件。

当试验结果呈单向变化时，也就是说最佳试验点只可能在试验中间点的一侧，可采用平分试验设计。

该方法简便易行，但要注意单向性特征。

（二）穷举试验设计与均分试验设计穷举试验设计是将所有可能的试验点在一批试验中全部进行试验。

均分试验设计是根据试验精度要求，均分整个试验范围以获得所有试验点。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 同时考虑如下 Cr2 个假设的检验问题，
H
ij 0
： i
j ，i
j, i,
j
1,2,
,r ．
•
样本均值
yi
应是
i
的很好估计，若
H
ij 0
为真，
yi y j
不应过大，过大就应拒绝
H
ij 0
．
5.效应模型
在单因子试验中，对水平 A1, A2 , , Ar 的选择方式有二种： •r 个水平 A1, A2 , , Ar 是特定的，如四个玉米品种，现要
3.单因素试验的方差分析
设 A 表示欲考察的因素，它的 r个不同水平，对应
的作指若标干视次作重复r 试个验总：体nX1,1n, X2 ,2.,....n.Xr .r（. 每可个等水重平复下也，可我不们等
重复），同一水平的
的一个样本：X i1, X i2 ,
ni 个结果，就是这个总体
...X ini .
0
H
1：
2 a
0
若拒绝
H
0
，就意味着
2 a
>0，从而认定
A
的随机效应存
在显著差异，
2 a
愈大，此种差异就愈大。
在方差分析中，总平方和的分解和检验的统计量都
与固定效应完全一样，只是各平方和的含义略有差别。
谢谢！请老师和同学们指正！
如今我们选用不平衡设计，即A1, A2, A3, A4分别制作
了7,5,6,6个样品，共有24个样品等待测试。
2.单因素试验举例——随机化
• 这里一次测试就是一次试验，试验次序要随机化。
因子 A 的水平
试验编号
A1
1234567
A2
8 9 10 11 12
A3
13 14 15 16 17 18
A4
H1：诸ai不全为0
这一对假设与原先一对假设是等价的．
H 0 : 1 2 ... r H1 : 诸i 不全相等
例在绿茶中叶酸含量的例子中，已有：
r=4， m1 =7， m2 =5， m3 =6， m4 =6，n=24， y1 8.27，y2 7.50，y3 5.82，y4 6.35
y 7.02
其四个水平效应的估计值分别为 aˆ1 8.27 7.02 1.25
aˆ2 7.50 7.02 0.48
aˆ3 5.82 7.02 1.20
aˆ4 6.35 7.02 0.67
其中两个是正效应，两个是负效应。
5.效应模型——随机效应模型
随机效应模型的数据结构式
yij
试验设计与分析及参数优化
单因素试验
One-factor experimental design
主要内容
1.基本概念 2.单因素试验举例分析 3.单因素试验的方差分析方差分析 4.多重比较 5.效应模型
1.基本概念
概念——单因素试验顾名思义，是指在试验过程中只有一个被研究的因素，或者说研究者只是针对一个因素对考察指标的作用影响，需要强调的一点是，单因素试验并不是说该试验的影响因素只有一个。
比较其优劣．
•r 个水平 A1, A2 , , Ar 是从众多水平中随机选出来的，如
绿茶的产地有很多，现随机从市场上购买四种绿茶作叶酸含量的测定与比较．
如何从统计模型区别这二种不同的单因子试验呢？效应模型因此需要而产生，它可分为两类：
• 固定效应模型 • 随机效应模型
5.效应模型
在单因子试验中，对水平 A1, A2 , , Ar 的选择方式有二种： •r 个水平 A1, A2 , , Ar 是特定的，如四个玉米品种，现要
6.35
2. 单因子试验——一般概述
在一个试验中只考察一个因子A及其r个水平A1，A2，… ，Ar．
在水平Ai下重复mi次试验，总试验次数n= m1+m2 +…+ mr．记yij是第i个水平下的第j次重复试验的结果，这里 i ——水平号，j ——重复号．
经过随机化后，所得的n个试验结果列于表2.2.1．
2.单因素试验——三项基本假定
自正1.态正总态体性：N (在i水,平i2 ) 的Ａ一i下个的样数本据，yi1i,=y1i2,2,……,,ry。imi是来
2.方差齐性：r个正态总体的方差相等，即：
2 1
2 2
2 r
2。
3.随机性：所有数据yij都相互独立。
图2.2.1 单因子试验所涉及的多个正态总体
灯泡的使用寿命——试验指标灯丝的配料方案——试验因素（唯一的一个）四种配料方案（甲乙丙丁）——四个水平因此，本例是一个四水平的单因素试验。用X1，X2，X3，X4分别表示四种灯泡的使用寿命，即为四个总体。假设X1，X2，X3，X4相互独立，且服从方差相同的正态分布，即Xi~N（i，2）（i=1，2，3，4）本例问题归结为检验假设 H0：1= 2= 3= 4 是否成立
由于同一水平下重复试验的个体差异是随机误差，所以设：
X ij i ij , j 1, 2,...ni , i 1, 2,...r 线性统计模型
其中为试验误差，相互独立且服从正态分布 ij 即 ij ~ N 0, 2
4.多重比较
在确认因子 A 的 r 个水平均值间有显著差异的情况下，进一步要问：哪些水平均值间确有显著差异，这就要进行多重比较。同时比较任意两个水平间有无显著差异的问题称为多重比较。
它表示水平 Ai 的均值中除去总均值后特有的贡献，称 ai 为水平 Ai 的效应．
5.效应模型——固定效应模型
r
水平 Ai 的效应 ai 可正可负，且有约束 ai 0 ．
这样一来，数据结构可改写为：
i 1
yij ai ij，i 1,2, , r，j 1,2, , mi ，
其中
• 是因子 A 的全部水平下指标的总均值，它是待估
19 20 21 22 23 24
•把试验结果“对号入坐”，填写试验结果。
因子 A 的水平
数据（毫克）
样本均值
A1
7.9 6.2 6.6 8.6 8.9 10.1 9.6 8.27
A2
5.7 7.5 9.8 6.1 8.4
7.50
A3
6.4 7.1 7.9 4.5 5.0 4.0
5.82
A4
6.8 7.5 5.0 5.3 6.1 7.4
则：Var( yij
)
2 a
2
其中
2 a
和
2
称为
yij
的两个方差分量，故随机效应模
型又称为方差分量模型．
5.效应模型——随机效应模型的方差分析
随机效应模型中的检验假设：因子 A 的一切可能的
效应是否相等，等价于检验随机效应的方差
2 a
是否为
0，只有方差为 0 的随机变量才为常数。即：
H
0：
2 a
2.单因素试验举例
例: 茶是一种大众饮品，它含有叶酸（一种维生素B），
今要研究各地的绿茶中叶酸的含量是否有显著差异？
问题中，绿茶是一个因子，用A表示。选定四个产地的绿茶，记为A1, A2, A3, A4，它是因子A
的四个水平。为测定试验误差，需要重复
各水平重复数相等的设计称为平衡设计. 各水平重复数不等的设计称为不平衡设计.
水平——可控因素所处的各种各种不同的状态。每个水平又称为试验的一个处理。
目的——考察某一个因素对试验结果的影响。
2.单因素试验举例
例（灯丝的配料方案优选）某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡，在每批灯泡中作随机抽样，测量其使用寿命（单位：小时），数据如下：
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 1570 1680 1600
2.单因素试验举例——分析
设因子 A 有 r 个特定水平 A1, A2 , , Ar ，在水平 Ai 下重复进行 mi 次试验，由三项基本假定可得 yij ~ N (i , 2 ) ．这时数据 yij 有如下结构：
yij i ij，i 1,2, , r，j 1,2, , mi ．
若记为总平均值
则 ai i ， i 1,2, , r ，
ai
ห้องสมุดไป่ตู้
，
ij
i 1, 2,L , r，j 1, 2,L , mi
其中
• 是因子 A 的全部水平指标的总均值；
• ai 是第 i 个水平的随机效应．一般假定 a1, a2 , , ar 是
来自某正态分布
N
(0,
2 a
)
的一个随机样本；
• ij ~ N (0, 2 ) 是随机误差；
•诸 ai 与诸 ij 是相互独立的随机变量．
表2.2.1 单因子试验的数据
因子 A 的水平
A1 A2
Ar
数据
y11 y12 y1m1 y21 y22 y2m2
yr1 yr 2 yrmr
和
T1 y11 y12 y1m1
均值
y1 T1 / m1
T2 y21 y22 y2m2
y2 T2 / m2
…
…
Tr yr1 yr 2 yrmr yr Tr / mr
比较其优劣．
•r 个水平 A1, A2 , , Ar 是从众多水平中随机选出来的，如
绿茶的产地有很多，现随机从市场上购买四种绿茶作叶酸含量的测定与比较．
如何从统计模型区别这二种不同的单因子试验呢？效应模型因此需要而产生，它可分为两类：

单因素试验

单因素实验设计报告

单因素实验设计

单因素试验的方差分析——概率论与数理统计(李长青版)

25.单因素试验的方差分析

单因素试验方差分析(试验数据处理)

单因素试验.

第9.1节 单因素试验的方差分析——概率论与数理统计(李长青版)

单因素实验设计

第9.1节单因素试验的方差分析——概率论与数理统计(李长青版)