1第6章方差分析

合集下载

第6章群体间的差异比较方差分析

第6章群体间的差异比较方差分析

第6章群体间的差异比较方差分析差异比较方差分析又被称为方差分析(ANOVA),是一种用于比较两个或多个群体之间差异的统计方法。

它可以帮助我们确定群体之间是否存在显著差异,并且确定这些差异是否因为随机变异引起的。

差异比较方差分析可以分为单因素方差分析和多因素方差分析。

在本章中,我们将讨论单因素方差分析,即只包含一个自变量的情况。

单因素方差分析是一种广泛应用于实验研究和调查研究中的方法。

它的基本假设是各个群体的数据是来自于正态分布的总体,并且总体的方差相等。

差异比较方差分析的步骤如下:1.确定研究假设:首先,我们需要确定研究的目的和假设。

例如,我们可能希望比较不同教育水平的学生在考试成绩上是否存在差异。

我们的零假设可以是“不同教育水平的学生在考试成绩上没有差异”。

2.收集数据:然后,我们需要收集适当的数据。

对于单因素方差分析,我们需要至少有两个群体,并且每个群体有至少三个观察值。

例如,我们可以选择三个不同教育水平的学生,并记录他们的考试成绩。

3.计算平均值和方差:接下来,我们需要计算每个群体的平均值和方差。

平均值代表了群体的中心趋势,而方差代表了群体内部的差异程度。

在单因素方差分析中,我们还需要计算每个群体之间的方差。

4.计算方差分析统计量:然后,我们可以计算方差分析的统计量F值。

该值代表了群体间和群体内的方差之间的比值。

F值越大,说明群体间的差异较大;当F值接近于1时,说明群体间和群体内的差异大致相等。

5.检验假设:最后,我们需要使用统计软件或查找F分布表来计算F 值的p值。

如果p值小于事先设定的显著性水平(通常为0.05),我们可以拒绝零假设,并得出结论认为群体之间存在显著差异。

总结起来,差异比较方差分析是一种用于比较两个或多个群体之间差异的统计方法。

它需要满足正态分布的总体和相等方差的假设。

通过计算方差分析的统计量F值,并进行假设检验,我们可以确定群体间是否存在显著差异,从而帮助我们进行更深入的研究和分析。

第6章-正交试验设计结果的方差分析

第6章-正交试验设计结果的方差分析

(4)计算F值
• 各均方除以误差的均方,例如:
FABiblioteka VA Ve或FA
VA V e
FAB
VAB Ve

FAB
VAB Ve
(5)显著性检验
• 例如: • 若 FAF(fA,f,e)则因素A对试验结果有显著影
响 • 若 F A BF (fA B,fe,)则交互作用A×B对试验结
果有显著影响
(6)列方差分析表
设:
QT
n
x
2 i
i1
n
T xi i1
②各因素引起的离差平方和
• 第j列所引起的离差平方和 :
Sj
1( m r p1
Kp2j
)T2 n
k
ST S j Se j 1
③交互作用的离差平方和
• 若交互作用只占有一列,则其离差平方和就等于 所在列的离差平方和
• 若交互作用占有多列,则其离差平方和等于所占 多列离差平方和之和,
• 例:3时
S S S AB ( AB ) 1 ( AB ) 2
④试验误差的离差平方和
• 方差分析时,在进行表头设计时一般要求留有空 列,即误差列
• 误差的离差平方和为所有空列所对应离差平方和 之和 :
Se S空列
(2)计算自由度
①总自由度 :=n-1 ②任一列离差平方和对应的自由度 :
=m-1 ③交互作用的自由度 :(以A×B为例) ×B= × ×B=(m-1 ) 若m = 2, ×B= 若m = 3, ×B= 2 + ④误差的自由度:
• 方差分析的基本步骤如下: • (1)计算离差平方和 • (2)计算自由度 • (3)计算平均离差平方和(均方) • (4)计算F 值 • (5)显著性检验

第六章 方差分析

第六章 方差分析
4)输出结果及分析
2015-5-10 18
表6-2 灯泡使用寿命的单因素方差分析结果
ANO VA HOURS Between Groups Within Groups Total Sum of Squares 39776.456 178088.93 217865.38 df 3 22 25 Mean Square 13258.819 8094.951 F 1.638 Sig. .209
2015-5-10 4
二、相关概念 1、影响因素的分类:在所有的影响因素中根据是否可以人为 控制可以分为两类,一类是人为可以控制的因素,称为控制因 素或控制变量,如种子品种的选定,施肥量的多少;另一类是 认为很难控制的因素,称为随机因素或随机变量,如气候和地 域等影响因素。在很多情况下随机因素指的是实验过程中的抽 样误差。 2、控制变量的不同水平:控制变量的不同取值或水平,称为 控制变量的不同水平。如甲品种、乙品种;10公斤化肥、20公 斤化肥、30公斤化肥等。 3、观测变量:受控制变量和随机变量影响的变量称为观测变 量,如农作物的产量等。 方差分析就是从观测变量的方差入手,研究诸多控制变量 中哪些变量是对观测变量有显著影响的变量,并分析对观测变 量有显著影响的各个控制变量的不同水平以及各水平的交互搭 配是如何影响观测变量的一种分析方法。
图6—2 Contrasts对话框
2015-5-10 12
(2)Post Hoc选项 Post Hoc选项用来实现多重比较检验。
提供了18种多重比较检验的方法。其中 Equal Variances Assumed框中的方法适用于 各水平方差齐性的情况。在方差分析中,由于其 前提所限,应用中多采用Equal Variances Assumed框中的方法。多重比较检验中,SPSS 默认的显著性水平为0.05,可以根据实际情况修 改Significance level后面的数值以进行调整。

第六章方差分析

第六章方差分析

2se( 2 LSD检验)
x
n0
x1 x2
n0
第三节双因素方差分析
1、试验指标:衡量试验结果的标准 2、因素(factor):也叫因子,是指对试验指标有影响,在研究中加以(控制)考虑的试验
4
条件。 3、可控因子:在试验中可以人为地加以调控的因子浓度、温度等 4、非控因子:不能人为调控的因素(气象、环境等) 5、固定因素:指因素的水平是经过特意选择的 6、随机因素:指因素的水平是从该因素水平总体中随机抽出的样本 7、水平(level):每个因素的不同状态(从质或量方面分成不同的等级) (因素是一个抽象的概念,水平则是一个较为具体的概念) 8、处理:指对试验对象施以不同的措施(对单因素试验而言,水平和处理是一致的,一个 水平就是一个处理;对多因素试验而言,处理就是指水平与水平的组合) 9、固定效应(fixed effect):由固定因素所引起的效应。 10、随机效应(random effect):由随机因素引起的效应。 11、二因素方差分析:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。 12、固定模型:二因素都是固定因素 13、随机模型:二因素均为随机因素 14、混合模型:一个因素是固定因素,一个因素是随机因素 15、主效应(main effect):各试验因素的相对独立作用 16、互作(interaction):某一因素在另一因素的不同水平上所产生的效应不同。 17、因素间的交互作用显著与否关系到主效应的利用价值 如果交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的 处理组合。 如果交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的 直接表现选定。有时交互作用相当大,甚至可以忽略主效应。 二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。 (一)无重复观测值的二因素方差分析 依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定 A 因素有 a 各水平,B 因素有 b 个水平,每个处理组合只有一个观测值。

第6章方差分析

第6章方差分析

第6章 方差分析一、单项选择题1. 方差分析是对多个正态总体( )这一假设进行检验的。

A.方差相等 B.方差相异 C.均值相等 D.均值不等2.方差分析使用的统计量是F ( )A.是正态分布B.是正偏态分布C.是负偏态分布D.取值小于03.设单因素方差分析中随机误差项离差平方和为125,水平项离差平方和为375,则总离差平方和为( )A.250B.125C.375D.5004.在单因素方差分析中,已知总离差平方和SST 的自由度为24,水平项离差平方和SSA 的自由度为7,则误差项离差平方和SSE 的自由度为( ) A.17 B.24 C.7 D.315.()()11--r k 在无交互作用的双因素方差分析中是指( ) A.总离差平方和SST 的自由度 B.行因素离差平方和SSB 的自由度 C.列因素离差平方和SSA 的自由度 D.随机误差项离差平方和SSE 的自由度6. ()()11--r k 在有交互作用的双因素方差分析中是指( )A.行因素离差平方和SSB 的自由度B.列因素离差平方和SSA 的自由度C. 随机误差项离差平方和SSE 的自由度D.交互作用离差平方和SSBA 的自由度 7.在单因素方差分析中,为了度量分类型自变量与数量型因变量之间的关系强度,可以用R2来反映,这里( )A.SSE SSA R=2B.SST SSA R =2C.SST SSE R =2D. SSASSE R =2二、多项选择题1. 方差分析的基本假定有( )A.总体都服从正态分布B.每个总体都服从非正态分布C.每个总体的方差σ2都是相同的 D.每个总体的方差σ2不相同E.观测值是独立的2.一个单因素方差分析问题中,因素A 有4个水平,每个水平下的样本容量为5,则下列说法正确的是( ) A.检验的原假设为μμμμ4321:===H B.检验的临界值为()5,4F αC. 检验的原假设为μμμμμ54321:====H D. 检验的临界值为()16,3F αE.检验的统计量为163SSE SSA F =3.单因素方差分析中,因素A 的水平为5,每个水平下的样本容量为6,SST=120,SSA=75,则以下正确的是( )A .SST 的自由度=29 B.SSA 的自由度=4 C. SSE 的自由度=25D.MSE=1.8E. F=10.424.一个因素A 有6个水平、因素B 有4个水平的无交互作用的双因素方差分析中,以下说法正确的是( )A.数据共有24个B.SSE 的自由度=15C.SSA 的自由度=6D.SST 的自由度=23E.SST=SSA+SSB+SSE5.一个因素A 有7个水平、因素B 有8个水平的无交互作用双因素方差分析中,SST=225,SSA=78,SSB=140,则以下说法正确的是( )A.SSE=2B.SSE=7C.F A =78D.MSE=0.1667E. F A =13 6.一个行变量有4个水平、列变量有3个水平、行变量中每一个水平的行数为2的有交互作用双因素方差分析中,SST=5521,SSR= 4780,SSC= 37,SSRC=337,则下列说法正确的是( )A.SSE=367B.SSR 的自由度=3C.SSC 的自由度=2D.SSRC 的自由度=6E.SSE 的自由度=127.方差分析中,随机误差项SSE 的自由度( )A.在单因素方差分析中为r n -B.在无交互作用的双因素方差分析中为()1-m krC.在无交互作用的双因素方差分析中为()()11--r kD.在有交互作用的双因素方差分析中为()1-m krE.在有交互作用的双因素方差分析中为()()11--r k8.对于单因素方差分析来说,方差分析的基本假定可以表述为( ) A.n 个数据来源于n 个正态总体 B.因素A 的r 个水平相当于r 个正态总体 C.n 个正态总体的方差是相同的 D.r 个正态总体的方差是相同的 E.r 个正态总体中抽取的容量为nj的随机样本是相互独立的9.对于无交互作用双因素方差分析来说,方差分析的基本假定可以表述为( ) A.r 个列水平相当于r 个正态总体 B.k 个行水平相当于k 个正态总体 C.kr 个数据来自于kr 个正态总体 D.kr 个正态总体的方差是相同的E.kr 个正态总体中抽取的容量为1的随机样本是独立的10.对于有交互作用的双因素方差分析来说,方差分析的基本假定可以表述为( ) A. kr 个数据来自于kr 个正态总体 B. kr 个水平的组合相当于kr 个正态总体 C. kr 个正态总体的方差是相同的 D. kr 个正态总体中抽取的容量为1的随机样本是独立的 E. kr 个正态总体中抽取的容量为m 的随机样本是独立的 三、填空题1. 方差分析认为数据间的差异来自________________和_________________。

生物统计学 第六章 方差分析

生物统计学 第六章   方差分析
(1)LSD法
该法是最小显著差数(Least significant difference) 法的简称,是Fisher 1935年提出的,多用于检验某一对 或某几对在专业上有特殊探索价值的均数间的两两比 较,并且在多组均数的方差分析没有推翻无效假设H0 时也可以应用。该方法实质上就是t检验,检验水准无 需作任何修正,只是在标准误的计算上充分利用了样 本信息,为所有的均数统一估计出一个更为稳健的标 准误,因此它一般用于事先就已经明确所要实施对比 的具体组别的多重比较。
xij i ij
它是方差分析的基础。
6.2 方差分析的原理
方差分析的基本原理是认为不同处理组的均数间 的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差 异,称为组内差异,用变量在各组的均值与该组内变 量值之偏差平方和的总和表示,记作 SS e ,组内自由度 df e 。 (2) 实验条件,即不同的处理造成的差异,称为组间 差异。用变量在各组的均值与总均值之偏差平方和表 示,记作 SSt ,组间自由度 df t 。 总偏差平方和 SST SSt SSe 。
6.1 方差分析的相关术语
研究马氏珠母贝三亚、印度品系在不同地区的生 长差异,选择同一批繁殖的两品系马氏珠母贝的稚贝, 分别在海南黎安港、广东流沙港、广西防城港三个海 区进行养殖,每个地区每个品系养殖1000个,1年后 测定马氏珠母贝壳高与总重,比较生长差异。 这里壳高与总重称为试验指标,在试验中常会测定 日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生 理生化和体型指标(如血糖含量、体高、体重)等,这些 都是试验指标,就是我们需要测量的数据。
6.4 均值间的两两比较
对完全随机设计多组平均水平进行比较时,当资料满 足正态性和方差齐性,就可以尝试方差分析,若得到 P>α的结果,不拒绝零假设,认为各组样本来自均数相 等的总体,即不同的处理产生的效应居于同一水平, 分析到此结束; 若方差分析结果P≤α,则拒绝零假设, 接受备择假设,认为各处理组的总体均数不等或不全 相等,即各个处理组中至少有两组的总体均数居于不 同水平。这是一个概括性的结论,研究者往往希望进 一步了解具体是哪两组的总体均数居于不同水平,哪 两组的总体均数相等,这就需要进一步作两两比较来 考察各个组别之间的差别。

第六章 方差分析

第六章   方差分析

5.交互作用(Interaction)
如果一个因素的效应大小在另一个因素不同水平下明显不同, 则称为两因素间存在交互作用。
方差分析的数学推导和计算过程 平方和和自由度的分解
平方和的分解
总变异=处理间变异+处理内变异
自由度的分解
总自由度=处理间自由度+处理内自由度 总自由度=处理间自由度+
SST=SSt+SSe
第六章 方差分析
教学目的和要求
1、掌握方差分析的基本原理及其基本概念,包括方差分析的理论 模型、处理因素、处理水平、单元、元素、均衡交互作用等。 2、掌握多猪比较的概念及其常用的多猪的几种多猪比较的方法。 3、进行方差分析的基本条件,方差齐次性检验。 、进行方差分析的基本条件,方差齐次性检验。 4、掌握进行双因子及多因子方差分析的条件和类型。 、掌握进行双因子及多因子方差分析的条件和类型。 5、熟练掌握应用SPSS for Windows下进行方差分析的步骤并且 Windows下进行方差分析的步骤并且 、熟练掌握应用SPSS 能对处理结果作出正确的解释。 教学难点 1、均方的分解。 2、试验处理和水平的确定。
进行方差分析的几个猪要的概念 1.因素(Factor) .因素
因素是可能对应变量有影响的变量,通常就是数学模型中的处理 处理。一 处理 般来说,因素会有不止一个水平,分析的目的就是考察或比较各个水 平对应变量的影响是否相同。因素的取值范围不能无限,只能有若干 个水平,在SPSS中应当将因素作为分类变量来处理。
在t检验中,
例6.1
Multiple Comparisons
Dependent Variable: 猪猪多(kg ) LSD
(I) GROUP
(J) GROUP
Mean Difference (I-J) 5.10000* 6.85000* 3.05000 -5.10000* 1.75000 -2.05000 -6.85000* -1.75000 -3.80000 -3.05000 2.05000 3.80000

1第6章方差分析

1第6章方差分析

1第6章⽅差分析1第6章⽅差分析⽅差分析是R. A. Fister 发明的,⽤于两个及两个以上样本均数差别的显著性检验. 由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,⼀是不可控的随机因素,另⼀是研究中施加的对结果形成影响的可控因素. ⽅差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献⼤⼩,从⽽确定可控因素对研究结果影响⼒的⼤⼩.6.1 单因素⽅差分析我们把在实验中或在抽样时发⽣变化的“量”称为因素或因⼦. ⽅差分析的⽬的就是分析因⼦对实验或抽样的结果有⽆显著影响. 如果在实验中变化的因素只有⼀个,这时的⽅差分析称为单因素⽅差分析;在实验中变化的因素不只⼀个时,就称多因素⽅差分析. 双因素⽅差分析是多因素⽅差分析的最简单情形.因⼦在实验中的不同状态称作⽔平. 如果因⼦A 有r 个不同状态,就称它有r 个⽔平. 我们针对因素的不同⽔平或⽔平的组合,进⾏实验或抽取样本,以便了解因⼦的影响. 当⽅差分析的影响因⼦不唯⼀时,必要注意这些因⼦间的相互影响. 如果因⼦间存在相互影响,我们称之为“交互影响”;如果因⼦间是相互独⽴的,则称为⽆交互影响. 互影响有时也称为交互作⽤,是对实验结果产⽣作⽤的⼀个新因素,分析过程中有必要将它的影响作⽤也单独分离开来.6.1.1 单因素⽅差分析的模型假设设某单因素A 有r 种⽔平:1A ,2A ,…,r A ,在每种⽔平下的试验结果服从正态分布2(,)i N µσ(1,2,,i r = ). 在各⽔平下分别独⽴做了i n (1,2,,i r = )次试验,所得数据见表,其中ij x 表⽰表⽰第i 种⽔平下第j 个试验数据. 判断因素A 对试验结果是否有显著影响. 这⾥我们假定各种⽔平下的试验结果有相同的标准差σ. 单因素⽅差分析问题可以归结为以下的假设检验: 012:r H µµµ=== 1:H 12,,,r µµµ 不全相等表6-1 单因⼦试验表6.1.2 单因素⽅差分析的原理如何检验统计假设0H ?⼀般情况下,1µ,2µ,,r µ不全相同将反映在ij x (1,2,,;i r = 1,2,,)i j n = 取值的⼤⼩不同上,这时离差211()in r ij i j S x x ===?∑∑也⽐较⼤. 其中111in r ij i j x x n ===∑∑,1ri i n n ==∑. 但是我们还不能只从S ⽐较⼤就断定1µ,2µ,,r µ不全相同,因为在1µ,2µ,,r µ全相同时,由于试验中的随机误差影响,S 也可能取⽐较⼤的值. 为了区别这两种情况,先把离差S 作⼀个分解. 令 11in i ijj ix xn ==∑2112112211111122111()()()()2()()()()ii ii iin rT ij i j n rij i i i j n n n rr r ij i i ij i i i j i j i j n rrij i i i i j i S x x x x x x x x x x x x x x x x n x x ==============?=?+?=?+?+??=?+?∑∑∑∑∑∑∑∑∑∑∑∑∑ (5. 1)记上式分解的第⼀项为e S ,第⼆项为A S . 211()i n r e ij i i j S x x ===?∑∑ , 1(rA i i i S n x x ==?∑有T A e S S S =+即总离差T S 等于组内误差e S 与组间离差A S 之和.下⾯分析e S : 对任⼀指定的1i r ≤≤,21()in ij i j x x =?∑是⽔平i A 下试验数据的离差,是由随机因素造成的. e S 是所有⽔平下离差的和,因⽽也是由随机因素造成的.形成A S 除了随机因素外,如果1µ,2µ,,r µ不全相同,这个差异也要从A S 反映出来,⼀般A S 取⽐较⼤的值. 因此,将A S 和e S ⽐较,如果A S 不太⼤,我们只能认为A S 是由试验的随机误差形成的,从⽽接受0H ;如果A S 太⼤,我们便有理由怀疑A S 完全是由试验的随机误差形成的,认为1µ,2µ,,r µ不全相同,从⽽拒绝0H . 我们将⽤形如A e S c S ??>的判别区域,c 由预先给定的信度α确定. 给定α后,需要计算统计量AeS S 在0H 为真时的分布. 可以证明,在0H 为真时,(1,)1A e S n p F p n p p S ~. 即1AeS n p p S ??服从参数为1p ?和n p ?的F 分布. 只需从F 分布表,查(1,)F p n p α??,使((1,))P F p n p αηα>??=. 其中(1,)F p n p η??~.最后得到的检验⽅法是: 若(1,)1AeS n p F p n p p S α??>,就拒绝0H ,否则接受0H图6-1. (4,10)F 时的F 曲线和0.05α=时的临界值6.1.3 单因素⽅差分析表对上⼀⼩节的分析进⾏总结,得到单因素⽅差分析表6-2. 表6-2 单因素⽅差分析表3若0.01(1,)F F r n r α>??,称因素A 对试验结果有⾮常显著的影响,⽤“* *”号表⽰;若0.050.01(1,)(1,)F r n r F F r n r α??<6.2 利⽤SPSS 进⾏单因素⽅差分析6.2.1 SPSS ⽅差分析对数据的要求应⽤⽅差分析对数据进⾏统计推断之前应注意样本分布的正态性,即偏态分布样本不宜⽤⽅差分析. 对偏态分布的样本应考虑⽤对数变换、平⽅根变换、倒数变换、平⽅根反正弦变换等变量变换⽅法变为正态或接近正态分布的数据后再进⾏⽅差分析.在⽅差分析的F 检验中,是以各个实验组内总体⽅差齐性(⽅差相等)为前提的,因此,按理应该在⽅差分析之前,要对各个实验组内的总体⽅差先进⾏齐性检验. 如果各个实验组内总体⽅差为齐性,⽽且经过F 检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体⽅差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有⼀部分归因于各个实验组内总体⽅差不同所致.但是,⽅差齐性检验也可以在F 检验结果为多个样本所属总体平均数差异显著的情况下进⾏,因为F 检验之后,如果多个样本所属总体平均数差异不显著,就不必再进⾏⽅差齐性检验.在使⽤SPSS 进⾏⽅差分析时,要求因⼦变量值为整数,⽽因变量应为定量变量(区间测量级别). SPSS 对于偏离正态的样本数据也是稳健的. 各组数据应来⾃⽅差相等的总体.6.2.2 SPSS ⽅差分析过程⽤SPSS 进⾏⽅差分析时,选项如图 .图 6-2 SPSS ⽅差分析的选项这些选项的含义如下:描述性:计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最⼩值、最⼤值和95%的置信区间.固定和随机效果:显⽰固定效应模型的标准差、标准误和95%置信区间,以及随机效应模型的标准误差、95%置信区间和成分间⽅差估计.⽅差同质性检验:计算Levene 统计量以检验组间⽅差是否相等. 该检验独⽴于正态分布的假设.Brown-Forsythe :指采⽤Brown-Forsythe 分布的统计量进⾏的各组均值是否相等的检验.Brown-Forsythe分布也近似于F分布,但采⽤Brown-Forsythe检验对⽅差齐性没有要求,所以当因变量的分布不满⾜⽅差齐性的要求时,采⽤Brown-Forsythe检验⽐F检验更稳妥。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1第6章 方差分析方差分析是R. A. Fister 发明的,用于两个及两个以上样本均数差别的显著性检验. 由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素. 方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小.6.1 单因素方差分析我们把在实验中或在抽样时发生变化的“量”称为因素或因子. 方差分析的目的就是分析因子对实验或抽样的结果有无显著影响. 如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;在实验中变化的因素不只一个时,就称多因素方差分析. 双因素方差分析是多因素方差分析的最简单情形.因子在实验中的不同状态称作水平. 如果因子A 有r 个不同状态,就称它有r 个水平. 我们针对因素的不同水平或水平的组合,进行实验或抽取样本,以便了解因子的影响. 当方差分析的影响因子不唯一时,必要注意这些因子间的相互影响. 如果因子间存在相互影响,我们称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响. 互影响有时也称为交互作用,是对实验结果产生作用的一个新因素,分析过程中有必要将它的影响作用也单独分离开来.6.1.1 单因素方差分析的模型假设设某单因素A 有r 种水平:1A ,2A ,…,r A ,在每种水平下的试验结果服从正态分布2(,)i N μσ(1,2,,i r = ). 在各水平下分别独立做了i n (1,2,,i r = )次试验,所得数据见表,其中ij x 表示表示第i 种水平下第j 个试验数据. 判断因素A 对试验结果是否有显著影响. 这里我们假定各种水平下的试验结果有相同的标准差σ. 单因素方差分析问题可以归结为以下的假设检验: 012:r H μμμ=== 1:H 12,,,r μμμ 不全相等 表6-1 单因子试验表6.1.2 单因素方差分析的原理如何检验统计假设0H ?一般情况下,1μ,2μ, ,r μ不全相同将反映在ij x (1,2,,;i r = 1,2,,)i j n = 取值的大小不同上,这时离差211()in r ij i j S x x ===−∑∑也比较大. 其中111in r ij i j x x n ===∑∑,1ri i n n ==∑. 但是我们还不能只从S 比较大就断定1μ,2μ, ,r μ不全相同,因为在1μ,2μ, ,r μ全相同时,由于试验中的随机误差影响,S 也可能取比较大的值. 为了区别这两种情况,先把离差S 作一个分解. 令 11in i ijj ix xn ==∑2112112211111122111()()()()2()()()()ii ii iin rT ij i j n rij i i i j n n n rr r ij i i ij i i i j i j i j n rrij i i i i j i S x x x x x x x x x x x x x x x x n x x ==============−=−+−=−+−+−−=−+−∑∑∑∑∑∑∑∑∑∑∑∑∑ (5. 1)记上式分解的第一项为e S ,第二项为A S . 211()i n r e ij i i j S x x ===−∑∑ , 1(rA i i i S n x x ==−∑有T A e S S S =+即总离差T S 等于组内误差e S 与组间离差A S 之和.下面分析e S : 对任一指定的1i r ≤≤,21()in ij i j x x =−∑是水平i A 下试验数据的离差,是由随机因素造成的. e S 是所有水平下离差的和,因而也是由随机因素造成的.形成A S 除了随机因素外,如果1μ,2μ, ,r μ不全相同,这个差异也要从A S 反映出来,一般A S 取比较大的值. 因此,将A S 和e S 比较,如果A S 不太大,我们只能认为A S 是由试验的随机误差形成的,从而接受0H ;如果A S 太大,我们便有理由怀疑A S 完全是由试验的随机误差形成的,认为1μ,2μ, ,r μ不全相同,从而拒绝0H . 我们将用形如A e S c S ⎧⎫>⎨⎬⎩⎭的判别区域,c 由预先给定的信度α确定. 给定α后,需要计算统计量AeS S 在0H 为真时的分布. 可以证明,在0H 为真时,(1,)1A e S n p F p n p p S −⋅−−−∼. 即1AeS n p p S −⋅−服从参数为1p −和n p −的F 分布. 只需从F 分布表,查(1,)F p n p α−−,使((1,))P F p n p αηα>−−=. 其中(1,)F p n p η−−∼.最后得到的检验方法是: 若(1,)1AeS n p F p n p p S α−⋅>−−−,就拒绝0H ,否则接受0H图6-1. (4,10)F 时的F 曲线和0.05α=时的临界值6.1.3 单因素方差分析表对上一小节的分析进行总结,得到单因素方差分析表6-2. 表6-2 单因素方差分析表3若0.01(1,)F F r n r α>−−,称因素A 对试验结果有非常显著的影响,用“* *”号表示; 若0.050.01(1,)(1,)F r n r F F r n r α−−<<−−,则因素A 对试验结果有显著的影响,用“*”号表示; 若0.05(1,)F F r n r α<−−,则因素A 对试验结果的影响不显著.6.2 利用SPSS 进行单因素方差分析6.2.1 SPSS 方差分析对数据的要求应用方差分析对数据进行统计推断之前应注意样本分布的正态性,即偏态分布样本不宜用方差分析. 对偏态分布的样本应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态分布的数据后再进行方差分析.在方差分析的F 检验中,是以各个实验组内总体方差齐性(方差相等)为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验. 如果各个实验组内总体方差为齐性,而且经过F 检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致.但是,方差齐性检验也可以在F 检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F 检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验.在使用SPSS 进行方差分析时,要求因子变量值为整数,而因变量应为定量变量(区间测量级别). SPSS 对于偏离正态的样本数据也是稳健的. 各组数据应来自方差相等的总体.6.2.2 SPSS 方差分析过程用SPSS 进行方差分析时,选项如图 .图 6-2 SPSS 方差分析的选项 这些选项的含义如下:描述性:计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最小值、最大值和95%的置信区间.固定和随机效果:显示固定效应模型的标准差、标准误和95%置信区间,以及随机效应模型的标准误差、95%置信区间和成分间方差估计.方差同质性检验:计算Levene 统计量以检验组间方差是否相等. 该检验独立于正态分布的假设.Brown-Forsythe :指采用Brown-Forsythe 分布的统计量进行的各组均值是否相等的检验.Brown-Forsythe分布也近似于F分布,但采用Brown-Forsythe检验对方差齐性没有要求,所以当因变量的分布不满足方差齐性的要求时,采用Brown-Forsythe检验比F检验更稳妥。

Welch:采用Welch分布的统计量进行的各组均值是否相等的检验. Welch分布近似于F分布,采用Welch检验对方差齐性也没有要求,所以当因变量的分布不满足方差齐性的要求时,采用Welch检验比方差分析更稳妥.均值图:显示一个绘制子组均值的图表(每组的均值由因子变量的值定义).缺失值选项给出了对缺失值的处理方式.例6-1 表6-3是关于开发新的DVD播放器的调查数据文件. 营销团队调查并记录被调查者的人口统计信息及其对问题的回答. 不同年龄段的人们对DVD的评价打分是否不同?表6-3 关于DVD播放器的调查数据年龄性别关注组价格易用性外观支持度功能总分年龄组20 2 1 5 4 5 7 6 27 1 19 1 2 8 4 7 2 10 31 1 18 2 5 9 4 6 10 10 39 1 18 2 1 10 8 6 4 10 38 1 18 1 2 6 6 7 10 10 39 1 26 2 4 10 4 8 5 10 37 2 28 1 6 7 6 9 3 10 35 2 26 1 1 8 8 9 10 5 40 2 26 2 2 9 9 7 5 10 40 2 30 2 3 8 4 7 2 10 31 2 37 2 2 6 9 9 6 4 34 335 2 3 9 6 7 4 10 36 336 1 4 4 7 7 6 10 34 335 1 5 9 8 8 6 10 41 336 1 6 8 8 5 4 5 30 337 1 1 8 8 9 10 9 44 3 36 1 2 5 10 9 10 10 44 3 44 1 6 7 4 6 7 10 34 4 40 1 1 5 6 7 6 10 34 4 44 2 2 10 7 8 8 10 43 443 2 3 7 9 8 10 10 44 444 1 4 7 8 5 10 10 40 4 41 1 5 9 9 10 9 10 47 4 41 2 7 10 5 5 10 10 45 4 51 2 1 9 4 9 3 10 35 5 51 1 4 8 8 7 6 5 34 547 2 5 3 6 8 7 10 34 548 2 2 10 8 6 7 10 41 5 63 1 2 9 6 7 3 10 35 6 60 1 4 6 4 8 9 10 37 6 29 1 5 3 4 8 1 9 25 2 33 1 4 7 4 8 4 9 32 3 35 1 5 6 6 8 2 9 31 3 61 1 1 5 4 8 2 9 28 6 20 2 6 9 9 7 4 8 37 1 22 2 1 4 9 9 4 8 34 1 56 2 1 6 3 7 1 8 25 6 22 1 4 6 5 7 7 7 32 1 31 2 3 8 3 5 5 7 28 2 27 1 4 4 9 7 3 7 30 2 44 1 6 9 6 7 5 7 34 4 51 2 5 7 3 8 3 7 28 5 47 1 2 6 9 7 2 7 31 5520 1 3 4 5 6 9 6 30 1 29 1 2 6 9 7 1 6 29 2 36 2 3 8 8 8 2 6 32 3 55 2 3 10 8 8 2 6 34 6 54 1 5 9 5 5 3 6 286 21 1 3 67 7 1 5 26 1 20 2 6 7 48 3 5 27 1 28 2 5 5 4 8 2 5 24 2 27 1 6 4 8 7 5 5 29 2 51 2 4 8 6 6 3 5 28 5 63 2 5 6 5 7 3 5 26 6 39 1 1 8 9 8 2 4 31 4 42 2 3 9 7 5 3 4 28 4 51 1 6 7 5 6 4 4 26 5 62 1 4 8 3 8 5 4 28 6 23 1 4 6 8 8 3 3 28 1 23 2 5 10 4 7 3 3 27 1 49 1 6 8 6 6 3 3 26 5 51 2 3 5 9 6 4 3 27 5 47 1 3 4 3 9 2 3 21 5 53 1 6 9 6 7 4 3 29 6 27 1 1 4 10 9 1 1 25 2 50 2 1 6 5 7 1 1 20 5 56 2 3 4 6 5 2 1 18 6 61 2 2 9 4 7 5 1 26 6其中“价格得分”、“易用性得分”、“外观得分”、“支持度得分”、“功能得分”都分为10级,值为1至10;“年龄组”分为6级,分别对应10—24岁、25—31岁、32—38岁、39—45岁、46—52岁、53—59岁. 解 SPSS 操作步骤如下:(1)建立数据文件,并导入数据. 变量视图如下:图6-3 例6-1的数据文件(2)菜单栏点击“分析”,选择“比较均值”,选择“单因素Anova ”,打开“单因素方差分析”主对话框.(3)从左边源变量框中选取变量“总体评价”,然后按向右箭头,所选取的变量“得分”进入“因变量列表”框中. 从左边源变量框中选取变量“年龄组”,然后按向右箭头,所选取的变量“年龄组”进入“因子”框中. 如图6-4.图6-4 变量选取结果(4)点击对话框中的“选项”,勾选“描述性”和“方差同质检验”. (5)在主对话框中,单击“确定”提交. (6)输出结果及结果分析. 表6-4 描述结果 描述 总体评价 均值的 95% 置信区间 N 均值 标准差 标准误 下限 上限 极小值 极大值 18-24 13 31. 92 4. 958 1. 375 28. 93 34. 92 26 39 25-31 12 31. 08 5. 664 1. 635 27. 48 34. 68 24 40 32-38 10 35. 80 5. 308 1. 679 32. 00 39. 60 30 44 39-45 10 38. 00 6. 600 2. 087 33. 28 42. 72 28 47 46-52 12 29. 25 6. 047 1. 746 25. 41 33. 09 20 41 53-59 11 28. 55 5. 298 1. 598 24. 99 32. 10 18 37 总数6832. 226. 359. 77130. 6833. 761847表6-5 方差齐性检验结果 方差齐性检验 总体评价Levene 统计量 df1 df2 显著性 . 574562. 720表6-6 方差分析表 ANOV A 总体评价 平方和 df 均方 F 显著性 组间 733. 2745146. 655 4. 601 . 001 组内 1976. 417 62 31. 878 总数2709. 691 67表6-5中显著性值为0.720,明显大于0.05,所以各个年龄组的评价分方差相等. 方差分析方法适用.表6-6中显著性是F 统计量的p 值,这里为0.001. 由于显著值0.01p <,所以在置信水平0.99下拒绝零假设,即每个年龄组的平均评价分有非常显著差异.当方差分析的结果为拒绝0H 接受1H 时,只说明各组总体均数不全相等. 若想进一步了解哪两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较.各组的平均评价分如图:图6-5 各组的平均评价分数折线从图6-5看出,32—45岁的两个年龄组对DVD的平均评价分数较高. 32—38岁组和39—45岁组的平均分数统计意义上是否相同?低于32岁组和高于45岁组的平均分数统计意义上是否相同?可以应用均值的对照分析回答上述问题.针对上述问题,在作方差分析时,在图6-4所示界面中,点击“对比”按钮可以为每组设置系数,进行对比,设置过程如下:图6-6 对照分析中系数设置方差分析的输出结果为表6-7 :表6-7对比系数年龄组对比18-24 25-31 32-38 39-45 46-52 53-591 0 0 1 -1 0 02 . 5 . 5 0 0 -. 5 -. 5表6-8对比检验对比对比值标准误t df 显著性(双侧)总体评价假设方差相等 1 -2. 20 2. 525 -. 871 62 . 38772 2. 61 1. 633 1. 596 62 . 1161 -2. 20 2. 678 -. 821 17. 209 . 423不假设等方差2 2. 61 1. 594 1. 635 42. 280 . 110表6-9方差齐性检验总体评价Levene 统计量df1 df2 显著性. 574 5 62 . 720分析结果中给出了“假设方差相等”和“假设方差不相等”两种情况的对比检验结果.方差齐性检验,接受了方差相等的假设. 当我们假定方差相等时候,看到“39-45岁”年龄组没有明显比“32-38岁”年龄组更喜欢DVD. 低于32岁的组和高于45岁的组给出的分数在统计意义没有大的差别.我们也可以使用SPSS对任意两组进行比较.如前所述,当组的大小相等或接近相等的时候方差分析法是健壮的. 但是当组的大小相差很大时候,如何分析?例6-2 方差分析的健壮性. 某地某家银行三家分行的客户等待服务时间的数据见表6-10.表中给出的是客户进行交易的分行代码和客户的等待时间. 试分析三家银行的客户等待时间统计意义上是否相同.表6-10 三家分行的客户等待时间银行等待时间银行等待时间银行等待时间银行等待时间银行等待时间银行等待时间1 5. 54 1 5. 72 1 5. 31 2 4. 27 2 4. 083 4. 56 1 6. 12 1 5. 22 1 6. 06 2 5. 39 2 5. 59 3 5. 20 1 8. 25 1 4. 40 1 4. 42 2 4. 21 2 5. 09 3 4. 80 1 4. 32 1 4. 96 1 5. 44 2 3. 83 3 4. 93 3 3. 67 1 6. 90 1 5. 36 1 4. 24 2 4. 62 3 6. 86 3 5. 89 1 4. 92 1 4. 20 1 3. 97 2 4. 71 3 7. 05 3 5. 32 1 6. 25 1 5. 79 1 4. 83 2 3. 71 3 4. 97 3 6. 14 1 2. 41 1 3. 72 1 7. 40 2 3. 88 3 4. 65 3 4. 93 1 5. 25 1 4. 34 1 4. 57 2 5. 08 3 5. 43 3 6. 76 1 4. 95 1 3. 26 1 5. 07 2 6. 39 3 5. 61 3 2. 67 1 3. 47 1 4. 87 1 5. 80 2 6. 07 3 5. 78 3 6. 13 1 3. 40 1 5. 25 1 5. 19 2 4. 93 3 4. 94 3 6. 97 1 5. 97 1 6. 54 1 5. 21 2 5. 36 3 5. 04 3 6. 97 1 5. 50 1 8. 00 1 5. 48 2 5. 18 3 5. 70 3 4. 60 1 5. 92 1 4. 65 1 4. 70 2 4. 66 3 6. 25 3 4. 98 1 5. 79 1 7. 26 1 5. 99 2 6. 64 3 5. 59 3 4. 82 1 5. 10 1 8. 11 1 5. 95 2 5. 71 3 6. 12 3 4. 99 1 8. 14 1 5. 54 1 5. 27 2 6. 62 3 5. 51 3 5. 97 1 5. 68 1 6. 39 1 4. 46 2 6. 58 3 4. 50 3 4. 79 1 7. 91 1 6. 74 2 3. 14 2 4. 39 3 3. 04 3 5. 24 1 5. 34 1 5. 39 2 4. 74 2 5. 81 3 4. 60 3 5. 40 1 7. 51 1 6. 02 2 5. 04 2 7. 09 3 4. 27 3 4. 70 1 6. 47 1 4. 70 2 6. 19 2 5. 56 3 5. 57 3 3. 28 1 5. 11 1 7. 17 2 5. 75 2 3. 77 3 4. 21 3 7. 43 1 6. 57 1 7. 86 2 4. 15 2 6. 63 3 5. 21 3 6. 57 1 2. 48 1 7. 80 2 5. 00 2 6. 68 3 3. 83 3 3. 83 1 6. 50 1 2. 90 2 4. 79 2 5. 56 3 4. 69 3 6. 11 1 6. 55 1 3. 20 2 5. 01 2 7. 38 3 4. 86 3 5. 4091 6. 77 1 8. 752 5. 18 2 5. 353 5. 64 3 6. 54 1 5. 78 1 9. 90 2 6. 14 2 5. 34 3 3. 80 3 5. 71 1 5. 98 1 5. 88 2 4. 62 2 5. 73 3 4. 32 3 6. 13 1 4. 83 1 6. 67 2 5. 91 2 4. 72 3 5. 83 3 5. 60 1 3. 75 1 6. 17 2 3. 57 2 3. 53 3 4. 49 3 4. 18 1 4. 20 1 5. 32 2 6. 96 2 6. 45 3 6. 11 3 5. 16 1 5. 70 1 6. 43 2 4. 69 2 5. 43 3 6. 84 3 6. 37 1 3. 49 1 6. 10 2 3. 46 2 4. 48 3 5. 63 3 4. 57 1 7. 73 1 6. 27 2 6. 03 2 3. 86 3 4. 23 3 5. 78 1 3. 38 1 6. 47 2 4. 11 2 4. 05 3 5. 93 3 4. 82 1 5. 80 1 4. 99 2 5. 91 2 6. 14 3 6. 08 3 5. 63 1 5. 57 1 5. 08 2 6. 20 2 6. 71 3 5. 05 3 4. 88 1 6. 00 1 4. 94 2 5. 14 2 5. 40 3 6. 01 3 3. 71 1 7. 57 1 5. 26 2 5. 55 2 6. 52 3 6. 27 3 5. 05 1 5. 72 1 6. 34 2 6. 05 2 4. 30 3 5. 21 3 5. 56 1 6. 59 1 5. 59 2 5. 08 2 5. 01 3 4. 61 3 4. 86 1 4. 25 1 3. 78 2 3. 40 2 4. 60 3 6. 52 3 3. 62 1 4. 63 1 5. 78 2 5. 91 2 5. 59 3 5. 58 3 3. 82 1 4. 38 1 8. 00 2 4. 77 2 5. 59 3 4. 02 3 3. 14 1 5. 74 1 5. 23 2 6. 65 2 3. 12 3 5. 46 3 5. 87 1 4. 72 1 3. 64 2 3. 90 2 4. 90 3 5. 98 3 3. 04 1 5. 88 1 3. 63 2 5. 03 2 4. 67 3 4. 43 3 5. 33 1 6. 21 1 5. 68 2 4. 63 2 4. 26 3 3. 86 1 5. 85 1 4. 65 2 6. 33 2 6. 47 3 4. 32 1 3. 74 1 2. 36 2 5. 84 25. 7835. 98解 SPSS 操作步骤如下:(1) 建立数据文件. 变量视图如下:首先对数据进行观察,做箱图图6-7.图6-8 箱图箱图上看出分行A 的数据有异常值,ANOV A 方法在组的大小相等或近似相等时候是健壮的,但是现在每个银行的数据量差别很大. 下面进行方差分析.(2)点击方差分析主窗口中的“选项”按钮,设置如图6-8. 回到主界面点击“确定”进行分析.图 6-8 选项设置(3)输出结果及结果分析表6-11 描述结果描述等待时间(分钟)均值的 95% 置信区间N 均值标准差标准误下限上限Branch A 125 5. 5218 1. 36990 . 12253 5. 2793 5. 7643 Branch B 90 5. 2034 . 99963 . 10537 4. 9940 5. 4128 Branch C 100 5. 1891 . 99162 . 09916 4. 9924 5. 3859总数315 5. 3252 1. 16614 . 06570 5. 1959 5. 4545表6-12 方差齐性检验方差齐性检验等待时间(分钟)Levene 统计量df1 df2 显著性4. 062 2 312 . 018此结果说明各组的方差不等.表6-13 方差分析表ANOV A等待时间(分钟)平方和df 均方 F 显著性组间8. 017 2 4. 009 2. 985 . 052组内418. 983 312 1. 343总数427. 000 314表6-14 均值相等性的键壮性检验均值相等性的键壮性检验等待时间(分钟)统计量a df1 df2 显著性Welch 2. 622 2 206. 327 . 07511Brown-Forsythe3. 1852307. 396. 043a. 渐近 F 分布.表6-13表明显著性非常接近0. 05,但是由于各组数据量大小不等,我们不能确定是否相信此结果. 用Welch 统计量和Brown-Forsythe 统计量进一步检验,与标准的F 分析相反, Brown-Forsythe 分析的得到的显著性为0. 043,小于0. 05.;与标准的F 分析相比,Welch 统计量分析的显著性没有明显低于0. 05. 当组数据量大小不等和方差不等时,Welch 统计量分析比标准F 统计量和Brown-Forsythe 统计量分析有效. 所以这里认为三个分行的顾客等待时间统计意义上没有明显不同.6. 3 双因素方差分析讨论两个因素对试验结果影响的显著性,又称双因素方差分析.设因素A 有r 个水平12,,,r A A A ,因素B 有s 个水平12,,,s B B B . 在因素A 和B 的每一种组合水平i j A B ×下的试验结果ij x 服从正态分布. 2(,)(1,2,;1,2,,)ij ij x N i r j s μσ==∼这里假定ij x 有相同的标准差σ,尽管σ是未知的,总体均值ij μ可能不同.6.3.1 双因素无重复试验的方差分析双因子无重复试验的数据数据如表6-15所示.(1)计算平均值 总体数据均值:111r sij i j x x rs ===∑∑ i A 水平时均值:11si ij j x x s ==∑ij B 水平时均值:11rj ij i x x r ==∑i(2)计算离差平方和总离差平方和:()211rsT ij A B e i j S x x S S S ===−=++∑∑因素A 引起的离差平方和:22111()(s r rA i i j i i S x x s x x ====−=−∑∑∑i i因素B 引起的离差平方和:22111()()rssB j j i j j S x x r x x ====−=−∑∑∑i i误差平方和:211()r se ij i j i j S x x x x ===−−+∑∑i i(3)计算自由度A S 的自由度:1A df r =−B S 的自由度:1B df s =−e S 的自由度:(1)(1)e df r s =−− T S 的自由度:11T df n rs =−=− 综上,有T A B e df df df df =++ (4)计算均方1A A A A S SS df r ==−1B B B B S SS df s ==−(1)(1)e ee e S S S df r s ==−− (5)F 检验(,)A A A e e SF F df df =∼(,)BB B e eS F F df df =∼ 对于显著性检验水平α,查F 分布表,得(,)A e F df df α,(,)B e F df df α.若(,)A A e F F df df α>,则因素A 对试验结果有显著影响,否则无显著影响;若(,)B B e F F df df α>,则因素B 对试验结果有显著影响,否则无显著影响. 双因素无重复试验方差分析表如表6-16.双因子等重复试验的数据如表6-17所示. (1)计算平均值总体数据均值:1111r s cijk i j k x x rsc ====∑∑∑任一水平组合(,)i j A B 下均值:11cij ijk k x x c •==∑13i A 水平时均值:11si ij j x x sc •••==∑ j B 水平时均值:11rj ij i x x rc •••==∑ (2)计算离差平方和总离差平方和:2111(rscT ijk A B A B e i j k S x x S S S S ×====−=+++∑∑∑因素A 引起的离差平方和:21()rA i i S sc x x ••==−∑因素B 引起的离差平方和:21(sB j j S rc x x ••==−∑交互作用A B ×引起的离差平方和:211(r sA B ij i j i j S c x x x x ו••••===−−+∑∑误差平方和:2111()r s ce ijk ij i j k S x x •====−∑∑∑(3)计算自由度A S 的自由度:1A df r =−B S 的自由度:1B df s =−A B S ×的自由度:(1)(1)A B df r s ×=−− e S 的自由度:(1)e df rs c =−T S 的自由度:11T df n rsc =−=− 综上,有T A B A B e df df df df df ×=+++ (4)计算均方1A A A A S SS df r ==−1B B B B S SS df s ==−(1)(1)A B BA B A B S S S df r s ×××==−− (1)e ee e S S S df rs c ==− (5)F 检验(,)A A A e e SF F df df =∼(,)BB B e eS F F df df =∼ (,)A BA B A B e eS F F df df ×××=∼ 对于显著性检验水平α,查F 分布表,得(,)A e F df df α,(,)B e F df df α,(,)A B e F df df α×.若(,)A A e F F df df α>,则因素A 对试验结果有显著影响,否则无显著影响;若(,)B B e F F df df α>,则因素B 对试验结果有显著影响,否则无显著影响;若 (,)A B A B e F F df df α××>,则交互作用A B ×对试验结果有显著影响,否则无显著影响. 双因素等重复试验方差分析表如表6-17.6.4 利用SPSS 进行双因素方差分析6.4.1 SPSS 双因素试验的方差分析过程例6-3 将土质基本相同的一块耕地,分成大小均等的5块,每块又分成均等的四个小区. 有四个品种的小麦,在每一地块内被随机地分种在四个小区上,且每一小区用种量相同. 今测得其收获量如表6-18所示. 试以显著水平0.05α=和0.01α=判断地块和小麦品种的不同对收获量有无显著影响. 表6-18 小麦的收获量地块 小麦品种一 二 三 四 五 甲32. 3 34. 0 34. 7 36. 0 35. 5 乙33. 2 33. 6 36. 8 34. 3 36. 1 丙30. 8 34. 4 32. 3 35. 8 32. 8 丁29. 5 26. 2 28. 1 28. 5 29. 4操作之前,假设每种水平组合下,数据呈正态分布且方差相同. 解 使用SPSS 操作过程如下:(1)建立数据文件. 数据视图如下:图6-9 例6-3的数据文件 (2)点击主菜单“分析”项,在下拉菜单中点击“一般线性模型”项,在右拉式菜单中点击“单变量”项,系统打开单变量多因素方差分析设置窗口如图6-10.图6-10 单变量多因素方差分析窗口 (3)设置分析变量.设置因变量: 在左边变量列表中选“小麦产量”作为因变量; 设置因素变量: 选“地块”和“小麦品种”作为固定因子.设置随机因素变量: 可将某个变量作为随机变量.设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量选为协变量..设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中图 6-11 分析变量的设置结果(4)选择分析模型在主对话框中单击“模型”按钮,打开“单变量模型”对话框. 如图6-12. 在“指定模型”栏.中,指定分析模型类型图6-12 指定模型对话框“全模型”选项": 该项选择建立全模型. 全模型包括所有因素变量的主效应和所有的交互效应. 例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应.“设定”选项: 该项建立自定义的分析模型. 选定“设定”后,在“构建项”栏有如下几项选择:“交互”:可以指定任意的交互效应;“主效应”:可以指定主效应;“所有二阶”指定所有2维交互效应;“所有三阶”指定所有3维交互效应;以此类推.本例中建立分析模型中的主效应, 即在“构建项”栏用下拉按钮选中“主效应”. 一个变量名占一行称为主效应项. 本例将“地块”和“小麦品种”变量作为主效应. 本例属于无重复试验的方差分析,所以每种水平的交互组合下,只有一个试验数据,无法进行交互分析.对于可重复试验,可以建立交互项,分析模型中变量的交互效应. 例如,因素变量有“A”和“B”,可以通过如下操作建立它们之间的相互效应: 连续在“因子与协变量”框中同时选中“A”和“B”,单击向右的箭头, “A”和“B”交互效应出现在“模型”框中,模型增加了一个交互效应项 “A*B”.15“平方和”栏是分解平方和的选择项. “类型III”是系统默认的处理方法.“在模型中包含截距”栏选项: 通常截距包括在模型中. 如果能假设数据通过原点,可以不包括截距,即不选择此项.(5)选择对比方法在主对话框中单击“对比”按钮,打开“对比”比较设置对话框,可以选择对比方法.(6)选择均值图在主对话框中单击“绘图”按钮,打开“轮廓图”对话框,在该对话框中设置均值轮廓图.均值轮廓图(Profile Plots)用于比较边际均值. 轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值. 如果指定了协变量,该均值则是经过协变量调整的均值. 因变量做轮廓图的纵轴;一个因素变量做横轴.(7)选择多重比较在主对话框中单击“两两比较”选项,打开“单变量:观测值的两两比较”对话框. 本例选择了“land”和“wheat”进行比较,选择多重比较方法“LSD(L)”.(8)选择保存选项.在主对话框中单击“保存”选项,可以选择将计算所得的预测值、残差和检测值作为新的变量保存在编辑数据文件中,以便于在其他统计分析中使用这些值.(9)选择输出设置.在主对话框中单击“选项”选项,进行输出设置. 本例设置如图6-13.图 6-13 选项设置对话框(10)提交执行设置完成后,在多因素方差分析窗口框中点击“确定”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中.(11)输出结果及结果分析输出结果如表6-19、表6-20和图6-14所示.表6-19 主体效应的检验结果主体间效应的检验因变量:小麦产量源III 型平方和df 均方 F Sig.校正模型148. 744a7 21. 249 9. 702 . 000 截距21405. 424 1 21405. 424 9773. 423 . 000 land 14. 098 4 3. 525 1. 609 . 235 wheat 134. 646 3 44. 882 20. 492 . 000 误差26. 282 12 2. 19017总计21580. 450 20校正的总计 175. 02619a. R 方 = . 850(调整 R 方 = . 762) land 主效应,其偏差平方和反应的是不同地块造成对小麦产量的差异. 与wheat 偏差平方相同均属于组间偏差平方和;wheat 主效应,其偏差平方和反应的是不同小麦品种造成的小麦产量的差异; 误差,其偏差平方和反应的是组内差异,也称组内偏差平方和.方差分析结果表明:不同地块对小麦产量的偏差均方是14. 098,F 值为1. 609,显著性水平是0. 235,即p>0. 05,不存在显著性差异; 不同小麦品种对小麦产量的偏差均方是134. 646,F 值为20. 492,显著性水平是0. 000,即p<0. 05,存在显著性差异. 表6-20 多个比较结果 多个比较 小麦产量 LSD95% 置信区间 (I) 小麦品种 (J) 小麦品种均值差值 (I-J)标准 误差Sig. 下限 上限 2 -. 3000 . 93598 . 754 -2. 3393 1. 7393 3 1. 2800 . 93598 . 197 -. 7593 3. 3193 146. 1600* . 93598 . 000 4. 1207 8. 1993 1 . 3000 . 93598 . 754 -1. 7393 2. 3393 3 1. 5800 . 93598 . 117 -. 4593 3. 6193 246. 4600* . 93598 . 000 4. 4207 8. 4993 1 -1. 2800 . 93598 . 197 -3. 3193 . 7593 2 -1. 5800 . 93598 . 117 -3. 6193 . 4593 344. 8800* . 93598 . 000 2. 8407 6. 9193 1 -6. 1600* . 93598 . 000 -8. 1993 -4. 1207 2 -6. 4600* . 93598 . 000 -8. 4993 -4. 4207 43-4. 8800*. 93598. 000-6. 9193-2. 8407基于观测到的均值.误差项为均值方 (错误) = 2. 190.*. 均值差值在 . 05 级别上较显著.从表6-20中看到,小麦品种4和其它的品种有显著性差异,其它品种间没有显著性差异. 从边际曲线上也能看到这点.6.4.2 SPSS 双因素等重复试验的方差分析过程例6-5 表6-21给出了不同温度与不同湿度下粘虫发育历期表,请做重复试验的方差分析. 表6-11 不同温度与不同湿度粘虫发育历期表重 复相对湿度(%) 温度℃1 2 3 425 91. 2 95. 0 93. 8 93. 0 27 87. 6 84. 7 81. 2 82. 429 79. 2 67. 0 75. 7 70. 6 10031 65. 2 63. 3 63. 6 63. 3 25 93. 2 89. 3 95. 1 95. 5 27 85. 8 81. 6 81. 0 84. 429 79. 0 70. 8 67. 7 78. 8 8031 70. 7 86. 5 66. 9 64. 9 25 100. 2 103. 3 98. 3 103. 8 27 90. 6 91. 7 94. 5 92. 229 77. 2 85. 8 81. 7 79. 7 4031 73. 6 73. 2 76. 4 72. 5解 下面用两种方法求解方法一 使用SPSS 操作过程如下:(1)建立数据文件,变量视图如图6-15,数据视图如图6-16图6-15 数据文件的变量视图图6-16 数据文件的数据视图(2)点击主菜单“分析”项,进行菜单选择,如图6-17.图6-17 菜单操作(3)设置分析变量如果需要去除某个变量对因素变量的影响,可将这个变量移到“协变量”框中;如果需要分析权重变量的影响,将权重变量移到“WLS权重”框中. 设置分析变量如图6-18.图6-18 分析变量设置(4)选择分析模型本例将“温度”和“湿度”变量作为主效应. 在“因子与协变量”框的变量表中同时选中“温度和“湿度”变量,单击“构建项”栏内下拉按钮,选中“交互”项. 单击“构建项”栏内的右拉按钮,”.模型增加了一个交互效应项:“温度*湿度图6-19 模型设置(5)选择多重比较在主对话框中单击“两两比较”选项,打开“观察均值的两两比较”对话框,选择“温度”和“湿度”进行两两比较,然后选定多重比较方法“Duncan”和“Tamhane's T2”.(6)主对话框中选择“选项”,在“选项”对话框中选择“方差齐性检验”.(7)主对话框中选择“确定”,提交执行.19(8)输出结果及结果分析表6-22 主体间效应的检验结果主体间效应的检验因变量:黏虫历期源III 型平方和df 均方 F Sig.校正模型5489. 157a11 499. 014 28. 787 . 000截距323851. 735 1 323851. 735 18682. 032 . 000dampness 644. 000 2 322. 000 18. 575 . 000temp 4726. 301 3 1575. 434 90. 882 . 000dampness * temp 118. 856 6 19. 809 1. 143 . 358误差624. 057 36 17. 335总计329964. 950 48校正的总计6113. 215 47a. R 方= . 898(调整 R 方 = . 867)从表6-22中看到,不同温度对粘虫历期的偏差均方是1575. 434,F值为90. 882,显著性水平是0. 000,即p<0. 05,存在显著性差异;不同湿度对粘虫历期的偏差均方是322. 000,F 值为18. 575,显著性水平是0. 000,即p<0. 05,存在显著性差异;不同温度和不同湿度共同对粘虫历期的偏差均方是19. 809,F值为1. 143,显著性水平是0. 358,即p>0. 05,存在不显著性差异.方法二使用SPSS操作过程如下:(1)建立数据文件. 变量视图如图6-20,数据视图如图6-21.图6-20 数据文件的变量视图图6-21 数据文件的数据视图注意此时的变量视图设计与其它分析时的不同.(2)点击主菜单“分析”项,进行菜单选择,如图6-22.图6-12 菜单操作(3)设置被试内因子.首先进入如下对话框,在“被试内因子名称”中输入“temp”,“级别数”输入4,因为每个.水平组合重复测量了4次. 点击“添加”图6-22 设置被试因子(4)点击“添加”后,下方“定义”按钮变为可用,点击进入下列对话框图6-23 重复度量设置对话框(5)将“dampness”选入“因子列表”框,temp1——temp4分别选入“群体内变量(temp)”框内,如图6-24所示:图6-24 重复度量设置21(6)点击右上角“模型”按钮,进入以下对话框,选择“设定”,将“temp”选入“全体内模型”框,“dampness”选入“群体间模型”框,“构建项”选择“主效应”. 下方的平方和选“类型III”,这是对于平衡数据. 如果两组样本量不等,则选择“类型IV”. 点击“继续”返回.图6-25 重复度量模型设置(7)点击“绘制”按钮, 进入对话框图2-26. 将“temp”选入“水平轴”,“dampness”选入“单图”,然后点击“添加”按钮,下面框中会显示“temp*dampness”. 点击“继续”返回.图6-26 重复度量轮廓图设置(8)点击“两两比较”按钮,将“dampness”选入右侧“两两比较检验”框中,选中复选框“LSD”. 点击“继续”返回.图 6-27 两两比较均值设置(9)点击“选项”按钮,进入对话框图6-28. 将“time”选入“显示均值框”,选中“比较主效应”复选框,选中下方“描述统计”复选框. 下方显著性水平设为0. 05. 点击“继续”返回.图6-28 选项设置对话框(10)点击“确定”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中.(11)输出结果及结果分析输出结果如表6-23至表6-27和图6-29所示.表6-23 描述性统计表描述性统计量湿度均值标准偏差N40 101. 4000 2. 60896 425度下黏虫历期80 93. 2750 2. 83358 4100 93. 2500 1. 59478 4总计95. 9750 4. 55993 1240 92. 2500 1. 64215 427度下黏虫历期80 83. 2000 2. 28035 4100 83. 9750 2. 81943 4总计86. 4750 4. 75626 1240 81. 1000 3. 63410 429度下黏虫历期80 74. 0750 5. 71394 4100 73. 1250 5. 39838 4总计76. 1000 5. 85274 1240 73. 9250 1. 71148 431度下黏虫历期80 72. 2500 9. 79983 4100 63. 8500 . 91104 4总计70. 0083 6. 95799 12这是一个关于各个温度下的三组数据描述性统计.表6-24 球形度检验结果23Mauchly 的球形度检验b度量:MEASURE_1Epsilon a主体内效应Mauchly 的W 近似卡方df Sig.Greenhouse-Geisser Huynh-Feldt 下限temp . 311 9. 022 5 . 111 . 639 . 988 . 333检验零假设,即标准正交转换因变量的误差协方差矩阵与一个单位矩阵成比例.a. 可用于调整显著性平均检验的自由度. 在"主体内效应检验"表格中显示修正后的检验.b. 设计 : 截距 + dampness主体内设计: temp球形检验结果中0. 1110. 05p=>,所以满足球形分布假设,不需要进行多变量方差分析或者自由度调整.表6-25 多变量检验结果多变量检验c效应值 F 假设 df 误差 df Sig.Pillai 的跟踪. 964 61. 901a 3. 000 7. 000 . 000Wilks 的 Lambda . 036 61. 901a 3. 000 7. 000 . 000Hotelling 的跟踪26. 529 61. 901a 3. 000 7. 000 . 000 tempRoy 的最大根26. 529 61. 901a 3. 000 7. 000 . 000Pillai 的跟踪. 419 . 707 6. 000 16. 000 . 649Wilks 的 Lambda . 583 . 722a 6. 000 14. 000 . 639Hotelling 的跟踪. 710 . 710 6. 000 12. 000 . 649 temp * dampnessRoy 的最大根. 704 1. 877b 3. 000 8. 000 . 212a. 精确统计量b. 该统计量是 F 的上限,它产生了一个关于显著性级别的下限.c. 设计 : 截距 + dampness主体内设计: temp这是进行多变量方差分析的结果,给出了4种统计量,它们的检验结果一致,temp的0. 001p<,说明各个温度下的数据的差异有统计学意义,temp*dampness的0. 05p>,说明温度和湿度无交互作用,说明温度因素(即25摄氏度、27摄氏度、29摄氏度、31摄氏度)的作用不随湿度(即100%、80%、40%)的不同而不同.表6-26 主体内效应检验结果主体内效应的检验度量:MEASURE_1源III 型平方和df 均方 F Sig. 采用的球形度4726. 301 3 1575. 434 81. 842 . 000 Greenhouse-Geisser 4726. 301 1. 917 2465. 488 81. 842 . 000 Huynh-Feldt 4726. 301 2. 965 1593. 828 81. 842 . 000temp下限4726. 301 1. 000 4726. 301 81. 842 . 000。

相关文档
最新文档