第五章方差分析
SPSS 教程 第五章 方差分析

目录1、单因素方差分析1)准备分析数据2)启动分析过程3)设置分析变量4)设置多项式比较5)多重比较6)提交执行7)结果与分析2、多因素方差分析1)准备分析数据2)调用分析过程3)设置分析变量4)选择分析模型5)选择比较方法6)选择均值图7)选择多重比较8)保存运算值9)选择输出项10)提交执行11)结果分析方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。
(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。
总偏差平方和 SS t = SS b + SS w。
组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。
第5章方差分析

5.1.4 方差分析中的基本假定
(基本前提:独立、同分布、同方差)
一、因素中的k个水平相当于r个正态总体。 每个水平下的n个观察数据(试验结果)相当 于从正态总体中抽取的容量为n的随机样本。 (同分布) 二、r个正态总体的方差是相同。 即:σ12=σ22…….=σr2=σ2 (同方差) 三、从不同的正态总体中抽取的各个随机样 本是相互独立的。(独立)
SSE
j1 i1
r
nj
xijxj
(续前)
方差分析的优点之二:增加了稳定性 由于方差分析将所有的样本资料结合在一起, 故而增加了分析结论的稳定性。 例如:30个样本,每一个样本中包括10个观 察单位(n=10)。如果采用t检验法,则在两 两检验中,一次只能研究2个样本和20个观察 单位,而在方差分析中,则可以把30个样本 和300个样本观察单位同时放在一起、结合进 行研究。 所以,方差分析是一种实用、有效的分析方 法。
r
2
j1 i r
xij xj 2 x
j1 i1 2 r
nj
ij
xj
x
2
j
x
j1 i1
r
nj
x j x
2
j1 i1
nj
xij xj xj x SSE SSA
nj
j1 i1
2、随机误差项离差平方和(SSE)的计算 SSE反映的是水平内部或组内观察值的离散状 况。它实质上反映了除所考察因素以外的其 他随机因素的影响,反映样本数据( x i j ) 与水平均值 ( x j )之间的差异,故而称之 为随机误差项离差平方和或组内误差。计算 公式如下:
5章 方差分析

3、检验两个或多个因素间有无交互作用。
应用条件(P63)
1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差方差相等, 即方差齐。
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求;
H0:三种卡环抗拉强度的总体均数相等;各区组 卡环抗拉强度的总体均数相等
H1:三种卡环抗拉强度的总体均数不全相等;各 区组卡环抗拉强度的总体均数不全相等
0.05
2、计算F值
方差分析表
──────────────────────────
变异来源 SS
V
MS
F
──────────────────────────
2、如果方差分析无差别,分析结束。
多样本均数之间的多重比较
两两比较,又称基于方差分析的后续 检验(post hoc test)。
LSD-t检验和SNK检验
多个样本均数的比较一般分为两种情况:
①证实性实验研究:在设计阶段就根据研究目的或专业 知识决定某些均数间的两两比较,例如多个处理组与 对照组的比较,处理后不同时间与处理前的比较等。
MS组内 2
1 nA
1 nB
a 指样本均数排序后,比较的两组间包含的组数。
例5-3,SNK多重比较:
处理组
甲组
乙组
丙组
丁组
xi
ni
组次
0.2913 8 1
1.0200 8 2
2.1488 8 3
2.2650 8 4
S xA xB
MS组内 2
第五章 方差分析

例
例: n=4,se2 =9.113, dfe=12
S se2 9.11 31.50(9k4)g
x
n
4
查附表8,当dfe =12,M=2时, SSR0.05 =3.08,SSR0.01=4.32
LSR0.05 =1.5094×3.08=4.65 LSR0.01 =1.5094 ×4.32=6.52
按照方差分析的思想,把一个试验的总变异依 据变异来源分为处理效应的变异和试验误差的变异。 首先,将总平方和和总df分解为两个变异部分。
因为 x x x x j x j x
处理内的变异是 由随机误差引起
处理间平均数的 差异是由处理效
应引起的:
根据线性可加模型,则有:
(x - x )= (x- xi )+ ( xi – x )
差数> LSD0.05
差异显著*
差数> LSD0.01
差异极显著**
差数≤ LSD0.05
差异不显著
梯形比较法
不同品种间4个月增重量差异显著表
品种
xi 大白
平均数 30.9
差异显著性
xi 24.1 xi 25.8 xi 27.9
6.8 ** 5.1 * 3.0
沈花 27.9 3.8
2.1
沈白 25.8 1.7
平方和
自由度 方差
处理间 SSt 1n
Ti2Cdft k1
st 2
SS t df t
处理内
SSe SSTSSt
defk(n1)
se2
SS e df e
总变异 SST x2CdTf nk1
F值 F0.05、
0.01
如果F值不显著,则方差分析结论是变异来源主要 是误差引起的,所以过程到此结束。而如果F值显 著,说明变异来源主要是因为处理的差异,具体 何种处理存在差异?还需要进一步多重比较!
第五章方差分析

5.1.3方差分析的原理
方差分析认为,如果控制变量的不同水平对观测变量产生了显著影 响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之, 如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量 值的变动就不明显,其变动可以归结为随机变量影响造成的。 建立在观测变量各总体服从正态分布和同方差的假设之上,方差 分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显 著差异的推断问题了。 综上所述,方差分析从对观测变量的方差分解入手,通过推断控 制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是 否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量 影响的程度进行剖析。 根据控制变量的个数可将方差分析分为单因素方差分析、多因素 方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因 变量方差分析)和多元方差分析(多因变量方差分析)。
从左侧的变量列表中选择观测变量“胰岛质量”到 Dependent List框中,选择控制变量“药物组”到 Factor框中。
10
选择各组间两两比较的方法,单击“One-Way ANOVA”对 话框下方的“Post Hoc…”按钮,出现上图对话框,在Equal Variances Assumed复选框中选择“LSD”。
协变量“原工资”的相伴概率Sig为0.000,即 协变量对青年教师现工资的影响显著;“教师 级别”的相伴概率为0.997,大于0.05,即对青 年教师的工资影响不显著;“政策实施”的相 伴概率0.029,小于0.05,对青年教师工资影响 显著;两因素的交互作用的相伴概率为0.551, 大于0.05,即交互作用没有对结果造成显著影 响。
5.4.2 协方差分析的基本步骤 • 提出原假设:协变量对观测变量的线性影响是不显著的 ;在扣除协变量的影响条件下,控制变量各水平下观测 变量的各总体均值无显著差异。 • 计算检验统计量和概率P值 给定显著性水平与p值做比较:如果p值小于显著性水平 ,则应该拒绝原假设,反之就不能拒绝原假设。
第五章方差分析[统计学经典理论]
![第五章方差分析[统计学经典理论]](https://img.taocdn.com/s3/m/8103707959fafab069dc5022aaea998fcc224065.png)
第五章方差分析•如果要检验两个总体的均值是否相等,我们可以用t检验。
当要检验多个总体的均值是否相等,则需要采用方差分析。
•方差分析是R.A.Fister发明的,它是通过对误差的分析研究来检验两个或多个正态总体均值间差异是否具有统计意义的一种方法。
•由于各种因素的影响,研究所得的数据呈现波动,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果造成影响的可控因素,方差分析认为不同处理组的均值间的差异基本来源有两个:•组内差异:由随机误差造成的差异,用变量在各组的均值与该组内变量值之差平方和的总和表示,记作SSE。
•组间差异:由因素中的不同水平造成的差异,用变量在各组的均值与总均值之差平方和的总和表示,记作SSA。
•方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
•方差分析的三个条件:•被检验的各总体均服从正态分布;•各总体的方差皆相等;•从每一个总体中所抽出的样本是随机且独立的;方差分析的基本步骤:建立原假设H0:两个或多个总体均值相等。
将各不同水平间的总离差分成两个部分:组间差异SSA组内差异SSE构造检验统计量: F= MSA / MSE判断:在零假设为真时,F~F[(k-l),(n-k)]的F分布。
若各样本平均数的差异很大,则分子组间差异会随之变大,而F值也随之变大,故F检验是右尾检验。
当检验统计量F大于临界值时则拒绝原假设;或者根据 p值来判断,若p<α,则拒绝原假设§5.1 单因素方差分析(One-Way ANOVA过程)One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较。
5.1.1 界面说明【Dependent List框】选入需要分析的变量,可选入多个结果变量(应变量)。
方差分析

假设从总体中抽取容量为 n i 的样本: X i 1 , X i 2 ,..., X in , i 1,2,3,4
i
• 假设4个样本相互独立,则 X ij相互独立, 这里 4
n ni
i 1
• 提出假设:
H0 : 1 2 3 4
原假设等价于
H0 : 1 2 ... r 0
5.4
5.1.3. 统计分析
(一)假设检验 • 构造(5.4)的统计量。 n 1 记 X X ,
i
ni
j 1 ni j 1
i
ij
1 2 Si ni
(X
ij
Xi ) ,
2
i 1,2,...,r
分别为第i个总体的样本均值和方差。
——单因素方差分析数学模型
• 假设
H 0 : 1 2 ... r
• 引入记号: n ni(总次数)
i 1 r
1 r ni i n i 1
(理论总均值)
i i
(因素对指标的效应)
•
i 之间的差异等价于 i 之间的差异,
且
n
Tests of Between-Subjects Effects Dep endent Variable: 杀 虫率 Source Corrected Model Intercept 农药 Error Total Corrected Total Type III Sum of Squares 3794.500a 95340.115 3794.500 178.000 118693.000 3972.500 df 5 1 5 12 18 17 Mean Square 758.900 95340.115 758.900 14.833 F 51.162 6427.424 51.162 Sig . .000 .000 .000
第5章 方差分析

F检验
若实际计算的F值大于 F 0 . 0 5 ( d f , d f ) ,则 F 值在 α=0.05的水平上显著,我们以95% 的可靠性推断 2 2 St代表的处理间方差大于Se 代表的处理内方差。
1 2
这种用F值出现概率的大小推断两个总体方差 是否相等的方法称为 F检验。
F检验时,是将由试验资料所算得的F值与根 ,F 据df1=dft 和df2=dfe查表所得的临界F值F 相比较作出统计推断的。
1 1
k
n
x ) n (x i x )
2 2 1
k
(x
1 1
k
n
xi )
2
上式可简写成:SST=SSt+SSe 分别表示总 平方和,处理间平方和,处理内平方和。 即:总平方和=处理间平方和+处理内平
方和。
C=T2/kn:
SST
x C
2
1 2 SS t Ti C n SS e SS T SS t
P ( F F ) 1 F ( F )
F
f (F )d F
F表列出的是不同df1和df2下, P(F≥Fα)=0.05和P(F≥Fα)=0.01时的F值, 即右尾概率α=0.05和α=0.01时的临界F 值,一般记作F0.05(df1,df2), F0.01(df1,df2) 。
所以 d f T d f t d f e 综合以上各式得:
df T kn 1 df t k 1 df e df T df t
均方差,均方(mean square,MS)
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方 (mean square , MS )。组 间均方和组内均方的计算公式为 :
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表5.11 显著性差异检验
变异来源 组间变异 组内变异 总变异
SS 96.13 129.98 226.11
DF 3 24 27
MS 32.04 5.42
比较略。
三、组内又分亚组的单因素方差分析 单项分组资料,如果每组又分若干个亚组,而每个 亚组内又有若干个观察值,则为组内分亚组的单项 分组资料,称系统分组资料。亚组内还可分小组, 小组内还可分小亚组,……,如此一环套一环地分 下去。这种试验称为巢式试验。 设一系统分组资料共有r组,每组内又分m个亚组, 每一亚组内有n观察值,则该资料有rmn个观察值, 其资料类型如表。
类型 编 1 A B 12 14 2 13 10 号 3 14 11 4 15 13 5 15 14 6 16 11 7 17 8 总 和 102 73 平均 ki
14.57 7 12.17 6
C
D
9
12
2
11
10
10
11
9
12
8
13
10
12
12
11
80
72 327
10.00 8
10.29 7 11.28 28
r m n i 1 j 1 k 1 2
50 45 55 45 40 45 35 45 35 35 75 72.5
2 2 2 2 2
2
3206 .25
差异显著性检验结果 变异来源 培养液间 培养液内盆间 盆内株间 总变异 DF 3 8 36 47 SS 7126.56 1262.50 3206.25 11595.31 MS 2375.52 157.81 89.06 F 15.05** 1.77 F 0.05 4.07 2.22 F 0.01 7.59 3.04
例如:研究三种饲料配方在养鸡增肥上的效果。采 取三种饲料配方各喂养10只母雏鸡,于60天后观察 它们的重量,如下表所示:
饲料种类 A B C 鸡 重
1073 1058 1071 1037 1066 1026 1053 1049 1065 1051 1016 1058 1038 1042 4020 1045 1044 1061 1034 1049 1084 1069 1106 1078 1075 1090 1079 1094 1111 1092
r ki 2 r ki 2 r ki i 1 j 1 i 1 j 1 i 1 j 1
2
SS A X i。 X 。 。
r ki i 1 j 1
r ki
2
SS E X ij X i。
i 1 j 1
2
将要研究的特征指标称为因变量,因变量必须 是定量变量。 将影响因变量的条件称为因素(factor),因 素的不同状态称为水平(level)。
如果影响因变量的因素只有一个,称为单因素 方差分析; 如果影响因变量的因素有两个,称为双因素方 差分析;如果影响因变量的因素为多个,称为多因 素方差分析。
SST
x
r k i 1 j 1 ij
r k
2
T..2 n
MS A
n 1
2 r 2
Ti . n n i 1 i r 1
1 X i。 ki
X
i 1
ki
ij
1 r ki X 。。 X ij n i 1 j 1
SST X ij X 。 。
r k i 1 j 1
2
SST X ij X .. X ij X i. X i. X ..
P 2 3 4
SSR 0.05 3.26 3.39 3.47
SSR 0.01 4.74 5.00 5.14
LSR 0.05 11.83 12.31 12.60
43.8 47.5 53.8 55 625
66.3 72.5 775
培养液平均
41.3
52.1
73.3
64.6
57.8
培养液间离差平方和:
SS A mn xi xijk
r i 1 2
3 4 41.3 57.8 52.1 57.8 73.3 57.8 64.6 57.8 7126 .57
SS E X ij X i
r k i 1 j 1
2
1 r k 2 MS A X i X ij r 1 i 1 j 1
1 r k 2 MS E X ij X i n r i 1 j 1
例5.5,用五种不同的日照长度做处理,分别随机抽 取4个植株测量其株高(cm),数据如表,试检验 不同处理间的差异显著性(=0.01)。
r k
2
4 27.0 26.3 24.5 26.3 28.5 26.3 31.5 26.3 20.0 26.3
2 2 2 2
i 1 j 1
2
301 .2
SS E X ij X i
r k
2
24 27.0 30 27.0 28 27.0 26 27.0 21 20
二、组内观察值数目不等的单因素方差分析 在r组处理中,每处理观测值数目ki不等时,称为组 间观察值数目不等的单因素方差分析。
在作单因素方差分析计算时,SSA、SSB、MSA、 MSB可采用下式公式计算:
SS A X i X ij
r ki i 1 j 1
2
1 r ki 2 SS E X ij X i n r i 1 j 1
r m 1
m n
2
1
r
SS E 2
x
i 1 j 1 k 1
ijk
xij
2
MS A 测验各组间: F MS E1
MS E1 测验各亚组间: F MS E 2
进行组间平均数的多重比较时,单个平均数的标准 误为:
SEE1 MS E1 / mn
进行组内亚组间平均数的多重比较时,单个平均 数的标准误为:
我们希望通过所给的试验结果来比较三种饲料在养鸡 增肥的效果上是否存在显著差异?那种饲料更好?
第五章 方差分析
第一节 方差分析原理
第四章介绍了检验两个总体平均值是否相等的方法, 但在实际工作中有时会遇到要同时检验几个总体平均 值是否相等的问题。当然,可以采用前面介绍的方法 进行两两检验,但这样太费事了,而方差分析法提供 了一种同时检验几个总体平均值是否相等的方法。
SEE 2 MS E 2 / n
例5.7,在温室内以4种培养液(r=4)培养某作物, 每种3盆(m=3),每盆4株(n=4) ,一个月后测定 其株高生长量,得如下表5.14结果,试作方差分析。
培养液 盆号 生长量 A1 50 55 40 35 盆总和 平均 培养液总和 180 45 A A2 35 35 30 40 140 35 495 A3 45 40 40 50 175 B1 50 45 50 45 190 B B2 55 60 50 50 215 B3 55 45 65 55 220 C1 85 60 90 85 320 80 C C2 65 70 80 65 280 70 880 C3 70 70 70 70 280 70 D1 60 55 35 70 220 55 D D2 60 85 45 75 265 D3 65 65 85 75 290 277 5 总 和
对应表中资料,总变异自由度:rmn-1;组间变异自 由度:r-1;亚组间自由度:r(m-1);亚组内自由度: rm(n-1);r:因素水平数;m:亚组内水平数;n: 亚组内样本个数。
组间离差平方和、组内离差平方和计算公式为:
SS A mn xi xijk
r i 1
2
SS E1 nxij xi
r
2
T..2
T xij i. i 1 j 1 i 1 ni MSE nr
Ti. xij
j 1
k
i 1,2,, r
T.. Ti. xij
i 1 i 1 j 1
r
r
k
第二节
多重比较
一、最小显著差数法(D法)
药剂 A B 18 20
r ki 2 r ki i 1 j 1 i 1 j 1 r ki 2 r ki 2 r ki
2
X ij X i. X i. X .. 2 X ij X i. X i. X ..
i 1 j 1
ki
i 1 j 1
i 1 j 1
苗高观测值 21 20 24 26
13 22
总和 72 92
平均 18 23
C
D
10
28
15
27
17
29
14
32
56
116
14
29
四、多重比较结果的表示方法 (一)列梯形表法
处理
平均数 平均数-14
差
异 平均数-23
平均数-18
D
29
15**
11**
6*
B A C
23 18 14
9** 4
5*
(二)划线法
(三)标记字母法
处理 D B
苗高平均数 (cm) 29 23 a b
差异显著性 5% 1% A AB
A C
18 14
c c
BC C
方差分析的基本步骤
(1)将资料总变异的自由度和平方和分解为各变 异原因的自由度和平方和,并进而算得其均方;
(2)计算均方差,作出F测验,以证明了各变异因 素的重要程度; (3)对各平均数进行多重比较。
3.90 4.10 4.22 4.29