5、方差分析一
合集下载
统计学:5方差分析

统计学
ST管AT理IST者ICS层次水平的不同是否会导致评分的显著差异? (第三版)
一家管理咨询公司为 高、中、初级管 理者提供人力资 源讲座。听完讲 座后随机抽取不 同层次管理者大 满意度评分,取 0.05 的 显 著 性 水 平,检验管理者 层次水平的不同 是否会导致评分 的显著差异?
高级 7 7 8 7 9
统计学
STATISTICS (第三版)
第 5 章 方差分析
5.1 方差分析的基本原理 5.2 单因素方差分析 5.3 双因素方差分析
7-1
2008年8月
统计学
STATISTICS (第三版)
学习目标
方差分析的基本思想和原理 单因素方差分析 多重比较 双因素方差分析的方法
7-2
2008年8月
STATISTICS (第三版)
方差分析的基本假定
1. 正态性(normality)。每个总体都应服从正态分布, 即对于因子的每一个水平,其观测值是来自正态 分布总体的简单随机样本
2. 方差齐性(homogeneity variance)。各个总体的方 差必须相同,对于分类变量的k个水平,有 12=22=…=k2
3. 独立性(independence)。每个样本数据是来自因 子各水平的独立样本(该假定不满足对结果影响较 大)
7-5
2008年8月
统5.1计学方差分析的基本原理
STATISTICS (第三版)
方差分析的基本假定
如果原假设成立,即H0 :m1=m2=……=mk
自变量对因变量没有显著影响
每个样本都来自均值为m、方差为 2的同一正态总体
中级 8 9 8 10 9 10 8
初级 5 6 5 7 4 8
5第三章 方差分析1

i 1
0
平方和与自由度的分解
∴ ( xi j x..)2
i 1 j 1
k
k
n
n ( xi. x..) ( xij xi. )
2 i 1 i 1 j 1
k
n
2
其中
n ( xi. x..)2
i 1
k
称为处理间平方和,记为SSt,即
而
( x
假设某单因素试验有k个处理, 每个处理有 n 个观察值,共有 nk 个观测值。这类试验资料的数据 模式如表3-2所示。
表3-2 每处理具n个观测值的k组数据的符号表
处理
1 x11
2 x21 x22 … x2j
… … … … …
i xi1 xi2 …
… … … … …
k
xk1
xk2 … xkj
观 察 值
B C D
E
21 22 19
15
19 23 20
16
18 22 19
16
18 20 18
17
76 87 76
64
19.00 21.75 19.00
16.00
T=392 x..=19.6
解:
①建立假设 H0:各组平均数相等 HA:各组平均数不全相等 ②计算统计量 “F=组间均方/组内均方” 在计算组间均方时,使用自由度为(k-1), 计算组内均方时,使用自由度为 k(n-1)。
p25作业
4.从胡萝卜中提取β-胡萝卜素的传统 工艺提取率为91%。现有一新的提取 工艺,用新工艺重复8次提取试验,得 平均提取率=95%,标准差S=7%。试 检验新工艺与传统工艺在提取率上有 无显著性差异?
解: (1)提出假设 H0:μ=μ0=91%;即认为新工艺与传统工艺在提取率上无显著差异。 HA:μ≠μ0 (2)选取显著水平α=0.05
0
平方和与自由度的分解
∴ ( xi j x..)2
i 1 j 1
k
k
n
n ( xi. x..) ( xij xi. )
2 i 1 i 1 j 1
k
n
2
其中
n ( xi. x..)2
i 1
k
称为处理间平方和,记为SSt,即
而
( x
假设某单因素试验有k个处理, 每个处理有 n 个观察值,共有 nk 个观测值。这类试验资料的数据 模式如表3-2所示。
表3-2 每处理具n个观测值的k组数据的符号表
处理
1 x11
2 x21 x22 … x2j
… … … … …
i xi1 xi2 …
… … … … …
k
xk1
xk2 … xkj
观 察 值
B C D
E
21 22 19
15
19 23 20
16
18 22 19
16
18 20 18
17
76 87 76
64
19.00 21.75 19.00
16.00
T=392 x..=19.6
解:
①建立假设 H0:各组平均数相等 HA:各组平均数不全相等 ②计算统计量 “F=组间均方/组内均方” 在计算组间均方时,使用自由度为(k-1), 计算组内均方时,使用自由度为 k(n-1)。
p25作业
4.从胡萝卜中提取β-胡萝卜素的传统 工艺提取率为91%。现有一新的提取 工艺,用新工艺重复8次提取试验,得 平均提取率=95%,标准差S=7%。试 检验新工艺与传统工艺在提取率上有 无显著性差异?
解: (1)提出假设 H0:μ=μ0=91%;即认为新工艺与传统工艺在提取率上无显著差异。 HA:μ≠μ0 (2)选取显著水平α=0.05
第5章方差分析

5.1.3 方差分析的基本假设
(1) 各样本的独立性。 即各组观察数据,是从相互独立的总体中抽取的。 (2) 要求所有观察值都是从正态总体中抽取且方差相等。 在实际应用中能够严格满足这些假定条件的客观现象是很少的,在社会 经济现象中更是如此。但一般应近似地符合上述要求。水平之间的方差 (也称为组间方差)与水平内部的方差(也称组内方差)之间的比值是 一个服从F分布的统计量:
SPSS将自动计算检验统计量和相伴概率P值,若P值小于 等于显著性水平α,则拒绝原假设,认为因素的不同水平对 观测变量产生显著影响;反之,接受零假设,认为因素的不 同水平没有对观测变量产生原理
3. 多重比较检验问题 多重比较是通过对总体均值之间的配对比较来进一步检验 到底哪些均值之间存在差异。 4. 各组均值的精细比较 多重比较检验只能分析两两均值之间的差异性,但是有些 时候需要比较多个均值之间的差异性。具体操作是将其转 化为研究这两组总的均值是否存在显著差异,即与是否有 显著差异。这种比较是对各均值的某一线性组合结构进行 判断,即上述检验可以等价改写为对进行统计推断。这种 事先指定均值的线性组合,再对该线性组合进行检验的分 析方法就是各组均值的精细比较。显然,可以根据实际问 题,提出若干种检验问题。
F = 水平间方差 / 水平内方差 = 组间方差 / 组内方差
5.2 单因素方差分析
单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水平是 否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相 互独立的)因变量,由因素各水平分组的平均值之间的差异是否具有统计 意义。
5.2.1 单因素方差分析的基本原理 5.2.2 单因素方差分析的SPSS操作详解 5.2.3 课堂练习:化肥种类对粮食产量的影响
第五章方差分析

5.1.3方差分析的原理
方差分析认为,如果控制变量的不同水平对观测变量产生了显著影 响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之, 如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量 值的变动就不明显,其变动可以归结为随机变量影响造成的。 建立在观测变量各总体服从正态分布和同方差的假设之上,方差 分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显 著差异的推断问题了。 综上所述,方差分析从对观测变量的方差分解入手,通过推断控 制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是 否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量 影响的程度进行剖析。 根据控制变量的个数可将方差分析分为单因素方差分析、多因素 方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因 变量方差分析)和多元方差分析(多因变量方差分析)。
从左侧的变量列表中选择观测变量“胰岛质量”到 Dependent List框中,选择控制变量“药物组”到 Factor框中。
10
选择各组间两两比较的方法,单击“One-Way ANOVA”对 话框下方的“Post Hoc…”按钮,出现上图对话框,在Equal Variances Assumed复选框中选择“LSD”。
协变量“原工资”的相伴概率Sig为0.000,即 协变量对青年教师现工资的影响显著;“教师 级别”的相伴概率为0.997,大于0.05,即对青 年教师的工资影响不显著;“政策实施”的相 伴概率0.029,小于0.05,对青年教师工资影响 显著;两因素的交互作用的相伴概率为0.551, 大于0.05,即交互作用没有对结果造成显著影 响。
5.4.2 协方差分析的基本步骤 • 提出原假设:协变量对观测变量的线性影响是不显著的 ;在扣除协变量的影响条件下,控制变量各水平下观测 变量的各总体均值无显著差异。 • 计算检验统计量和概率P值 给定显著性水平与p值做比较:如果p值小于显著性水平 ,则应该拒绝原假设,反之就不能拒绝原假设。
第六章方差分析一

因此 当样本平均数的个数k≥3时,采用以往的方 法进行差异显著性测验,工作量是相当大的。
2. 推断的可靠性降低,犯错误的概率增大
两个样本平均数比较采用 t 或 u 检验,α=0.05时犯第 一类错误的概率为0.05, 推断的可靠性为1-α =0.95。
若对5个处理采用t 或 u 检验进行比较,α=0.05, 需进 行10次两两比较,每次比较的可靠性为1-α=0.95 , 要求 10次都正确的概率为(1-α)10=0.9510=0.5987, 因此推断 的可靠性由0.95降到0.5987, 犯第一类错误的概率则由 0.05上升到(1-0.5987)=0.4013。
由英国著名统计学家 R. A. FISHER在1923年提 出来的,也叫F检验。
一、方差分析的概念:
对两个或多个样本平均数差异显著性检验的方 法。
对观测值变异原因的数量分析
将试验数据的总变异分解为不同来源的变 异,从而评定不同变异来源的相对重要性的一 种统计方法。
二、方差分析的基本原理
方差分析是将k个处理的观测值作为一个整体 看待,把观测值总变异的平方和及自由度分解为相 应于不同变异来源的平方和及自由度,进而获得不 同变异来源总体方差估计值;通过计算这些总体方 差的估计值的适当比值,就能检验各样本所属总体 平均数是否相等。
我们的目的不在于研究供试处理本身的效应, 而在于研究处理效应的变异度,所以我们的推断也 不是关于某些供试处理,而是关于抽出这些处理的 整个总体。
特点:
a. 抽样方式是随机的,没有固定的标准 b. 试验的目的是估计样本所在总体的变异 c. 推断关于样本所在总体的变异 d. 检验后,不进行均数的多重比较,而
方差分析法是一种在若干能相互比较的资料组中, 把产生变异的原因加以区分开来的方法与技术。
2. 推断的可靠性降低,犯错误的概率增大
两个样本平均数比较采用 t 或 u 检验,α=0.05时犯第 一类错误的概率为0.05, 推断的可靠性为1-α =0.95。
若对5个处理采用t 或 u 检验进行比较,α=0.05, 需进 行10次两两比较,每次比较的可靠性为1-α=0.95 , 要求 10次都正确的概率为(1-α)10=0.9510=0.5987, 因此推断 的可靠性由0.95降到0.5987, 犯第一类错误的概率则由 0.05上升到(1-0.5987)=0.4013。
由英国著名统计学家 R. A. FISHER在1923年提 出来的,也叫F检验。
一、方差分析的概念:
对两个或多个样本平均数差异显著性检验的方 法。
对观测值变异原因的数量分析
将试验数据的总变异分解为不同来源的变 异,从而评定不同变异来源的相对重要性的一 种统计方法。
二、方差分析的基本原理
方差分析是将k个处理的观测值作为一个整体 看待,把观测值总变异的平方和及自由度分解为相 应于不同变异来源的平方和及自由度,进而获得不 同变异来源总体方差估计值;通过计算这些总体方 差的估计值的适当比值,就能检验各样本所属总体 平均数是否相等。
我们的目的不在于研究供试处理本身的效应, 而在于研究处理效应的变异度,所以我们的推断也 不是关于某些供试处理,而是关于抽出这些处理的 整个总体。
特点:
a. 抽样方式是随机的,没有固定的标准 b. 试验的目的是估计样本所在总体的变异 c. 推断关于样本所在总体的变异 d. 检验后,不进行均数的多重比较,而
方差分析法是一种在若干能相互比较的资料组中, 把产生变异的原因加以区分开来的方法与技术。
第五章 方差分析(第一节)

Copyright © 2008 Sichuan Agricultural University All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
方差分析的线性数学模型
• 方差分析的数学模型就是指试验资料的数
田间试验与统计分析
Field Experiment and Statistical Analysis
总变异:dfT nk 1
nk 1 (k 1) (nk k ) (k 1) k (n 1)
dfT df t df e
df t k 1, df e k (n 1)
因为 MSe 是σ2 的无偏估计量, MSt
是
n
2
2 的无偏估计量,所以
为2
MSe的数学期望(mathematical
2 expectation), n 2 为MSt的数学
期望。又因为它们是均方的期望值
(expected value),故又称期望均方,
简记为EMS(expected mean squares)。
田间试验与统计分析
Field Experiment and Statistical Analysis
第一节
方差分析的基本原理与步骤
一、线性模型与基本假定 二、自由度与平方和的分解 三、F检验 四、多重比较 五、单一自由度的正交比较*
Copyright © 2008 Sichuan Agricultural University All Rights Reserved
Copyright © 2008
Sichuan Agricultural University
田间试验与统计分析
Field Experiment and Statistical Analysis
方差分析的线性数学模型
• 方差分析的数学模型就是指试验资料的数
田间试验与统计分析
Field Experiment and Statistical Analysis
总变异:dfT nk 1
nk 1 (k 1) (nk k ) (k 1) k (n 1)
dfT df t df e
df t k 1, df e k (n 1)
因为 MSe 是σ2 的无偏估计量, MSt
是
n
2
2 的无偏估计量,所以
为2
MSe的数学期望(mathematical
2 expectation), n 2 为MSt的数学
期望。又因为它们是均方的期望值
(expected value),故又称期望均方,
简记为EMS(expected mean squares)。
田间试验与统计分析
Field Experiment and Statistical Analysis
第一节
方差分析的基本原理与步骤
一、线性模型与基本假定 二、自由度与平方和的分解 三、F检验 四、多重比较 五、单一自由度的正交比较*
Copyright © 2008 Sichuan Agricultural University All Rights Reserved
Copyright © 2008
Sichuan Agricultural University
试验五用dps进行方差分析一

A2
342 367
390 377
353 374
A3
330 352
388 380
378 359
练习:课本122页 例6.14。 127-129页所有的习题 实验报告:P128习题6.9
地块A A1
A2
A3
A4
A5
品种B
B1
32.3 34.0 34.7 36.0 35.5
B2
33.2 33.6 36.8 34.3 36.1
B3
30.8 34.4 32.3 35.8 32.8
B4
29.5 26.2 28.1 28.5 29.4
按双因素无重复进行分析
按单因素随机区组进行分析
(一)单向分组资料的方差分析
此类资料由完全随机试验获得
步骤:
输入数据(以行为样本或处理,一行一 个处理)-------定义数据块-------从菜单中找到 “试验统计”------- 选择“完全随机设计” ------“单因素试验统计分析”-------点击确定, 得到结果。
例:某公司对新销售人员进行不同的销售培训。 为了比较培训课程的有效性,随机选择了三组销 售人员,每组五人,一组接受A课程训练,一组接 受B课程训练,另一组C不接受任何训练。当前两 组的训练课程结束时,收集训练后两个星期内各 组销售人员的销售记录,进行方差分析。
A课程
2058 2176 3449 2517 944
B课程
3339 2777 3020 2437 3067
C组
2228 2578 1227 2044 1681
练习: 课本111页,例6.10;
课本113页,例6.11
双因素方差分析
1 无重复双因素方差分析
5第六章方差分析

练习
• 以小鼠研究正常肝核糖核酸(RNA)对癌细 胞的生物学作用,试验分为对照组(生理 盐水)、水层 RNA组和酚层RNA组,分别用 此三种不同处理诱导肝细胞的FDP酶活力, 得数据如下。该三组资料均服从正态分布, 试比较三组均数有无差别?
ex_36.sas
表 6.1 对照组
2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
复相关系数(确定系数),变异系数,均方根,总均数
对自变量的检验
R-Square:等于模型的平方和除以总 平方和,用于度量在因变量的变差 里能够由模型决定的比例有多少, 越接近1,效果越好。
检验的显著水平、自由度、 误差均方
具有相同字母的组间 均值差异没有统计学意义。
第2组具有A和B两个字母,所以 第二组和第三组,第一组均没有差异。
单因素方差分析
假设某单因素试验有k个处理,每个处理有n次重 复,共有nk个观测值。这类试验资料的数据模式
如下表所示。
(一)总平方和的分解 在上表中,反映全部观测值总变异的总平方和
是各观测值xij与总平均数的离均差平方和,记 为SST。即
kn
SST
( xij x.. ) 2
i1 j 1
nj 组内样本容量j 1,2,,n ki 组数,即水平数i 1,2,,k x.. 总平均数 xij i水平下第 j个样样本
变 差
组间 变差
总 变 差 组内 变差
组数(水平数)
(二)总自由度的剖分
在计算总平方和时,资料中的各个观测值要
kn
受 (xij x这..) 一0 条件的约束,故总自由度等于 i1 j1
资料中观测值的总个数减1,即kn-1。
dfT kn 1 df t k 1 df e dfT df t
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Σ(Y-Ӯ )2=Σ(Y - Ӯt) 2 + n ( Ӯt - Ӯ ) 2
A3 22.1 ……… 25.8 123.7 24.74 15.97
A4 27.0 ……… 28.5 139.8 27.96 22.33
再把全部处理观察值的……累加,得:
ΣΣ(Y-Ӯ )2=ΣΣ(Y-Ӯt) 2 + nΣ ( Ӯt-Ӯ ) 2 即: SST = (组内) SSe + (组间) SSt 其中 SSt = nΣ ( Ӯt-Ӯ ) 2 = Σ Tt 2 /n -C
dft = k - 1= 3 dfe= dfT - dft =19-3 = df1 + df2 + df3 +df4= 4 +4 +4+4 = 16
第一节 方差分析原理
三、列ANOVA表,进行F-test
变异来源 DF SS
MS F
F 0.01
处理 3 114.27 38.09 7.13 ** 5.29
Fisher’s protected multipe comparisons. 此前产生的复极差测验 (简称q-test、又 称SNK测验) 却可以不经过F-test, 原因 是q-test算LSRα时要改查q 值表(附表7), 所依据的q分布是按极差抽样分布原理 要保证各比较都是同一显著水平α, 因 而对 t 分布修正幅度随秩次距k的递增 而加大的速度要比SSR分布快, 所以秩 次距k≥3 时q0.05和q0.01 比相应的SSR0.05 和SSR0.01大。
A3 24.74
Ӯt-26.28 Ӯt-27.96
4.9 ** 3.22 * 1.68 ns
SE = 1.033
综合包括多重比较在内的方差分析 全过程,其原理可归纳为:
一个性质(SS、DF的可加性) 两个分布(F分布和SSR分布) 本例根据SSR分布进行的多重比较 叫新复极差测验, 简称SSR-test 。因为 不能缺少 F-test 显著的前提,属于
上升到26.5%( 即 “t0.05 ”= t0.265 )……以
此
类推……5个样本……40%以上。
第一节 方差分析原理
一、数据整理
饲料 鱼 的 增 重 (10g)
根据方差分析的先决条件,在“三个
Tt
Ӯt
SS
假定”成立的前提下,对右表继续整理: A1 31.9 ……… 35.9 155.9 31.18 41.67
S Ӯ1-Ӯ2 =√Se2 ( 1/n1 + 1/n2 ) = 1.70
t0.143)…
t =〔( Ӯ1- Ӯ2 ) -(μ1-μ2)〕÷ SӮ1- Ӯ2
继续以相同的容量每次抽四个样本,
= 6.44 ÷ 1.70 = 3.8 > “t0.05”=2.306
仍以Ӯ最大的和Ӯ最小的求算t 值, 则…… 的把由握于不撇到开8A0%、。B孤立地进行,否定HO
重要程度是否达到显著水平。
第一节 方差分析原理
四、多重比较 R.A.Fisher 创建的方差分析法并没有明确
(极)显著差异究竟存在于哪些 “组平均数” 之间, F值(极)显著所包含的信息只有通过 对C2n= k(k-1)/2个两两差数进行多次连续性
顺序 Ӯt Ӯt-24.74 27.96
A1 31.18 6.44 A4 27.96 3.22 A2 26.28 1.54 A3 24.74
dft = k - 1= 4 dfe= dfT - dft =24-4= 20
3、列ANOVA表,进行F-test
假设是Ho:σt2 ≤σe2 而不是Ho:σt2 =σe2
(和 Ho:μ1= μ2= μ3= μ4= μ5效果一样)
SOV DF SS MS F F 0.01 品种 4 73.2 18.3 5.83** 4.43
试验设计有几个可控因素, 数据就会有几种 可能的分组方式, 也就可以算出几个组间SS, 而 本属于组内SS的误差分量在平方和分解时总是 由SST 减去所有可控因素SS得到, 因此它又被称 为“剩余平方和”。
自由度的剖分与平方和的剖分一一对应。
㈡依据F分布进行整体测验; 只确定可控因素分量和误差分量的相对
第二节 单向分组数据
单向分组数据指观察值仅按一个方 向分组的数据。如例5.1中将全部供试单 品种 产仔数观察值(头) Tt Ӯt
位(试验材料)随机地分成若干组,然后
1 8 13 12 9 9 51 10.2
各组给以不同处理,即同组供试单位受 2 7 8 10 9 7 41 8.2
相同处理,不同组受不同处理,这样所 得的全部观察值在设计上称为完全随机 试验数据,而实际研究中下例5.2那样的 调查结果也属此类。
㈠平方和与自由度的可加性; SST 综合了全部观察值的变异量, 它汇总了
各变异来源 (SOV) 导致原始数据和全试验平均 数 ( Ӯ ) 出现差异的分量, 包括可控因素分量和 误差分量两类; “可加性” 证实前者就是观察 值按可控因素分组后算得的组间平方和 ( 可控 因素可以是试验因素, 也可以是象单位组那样 的其它系统因素 ) 。
测验才能完全揭露出来,这就是多重比较。
ν=16,k =2→
多重比较不论用哪一种方法, 区别于多 次孤立的 t-test 或者说体现其“连续性” 特征
ν=16,k =3→
Ӯt-26.28 Ӯt-
4.9
3.22
1.68
←SSR= t√2
之处有两个, 一是必须使用同一个共用的标 准误, 记为“SE”), 本例SE=√MSe / n = √5.34÷5 =1.033 (10g); 二是所依据的抽样分
A1 31.9 ……… 35.9 A2 24.8 ……… 26.2 A3 22.1 ……… 25.8
155.9 31.18 41.67 131.4 26.28 5.43 123.7 24.74 15.97
A4 27.0 ……… 28.5 139.8 27.96 22.33
比如本例针对药剂A1与药剂A3的两两差 数6.44 (最大Ӯ -最小Ӯ) 进行的t-test:
误差 20 62.8 3.14
总 24 136 4、多重比较
SE=√MSe / n =√3.14÷5 = 0.793
品种 产仔数观察值(头) Tt Ӯt
Y-Ӯ = (Y-Ӯt) + ( Ӯt -Ӯ ) 两边同时平方,得:
(Y-Ӯ )2 = (Y - Ӯt) 2 + ( Ӯt - Ӯ ) 2 +2 (Y - Ӯt) ( Ӯt - Ӯ )
由同一处理重复观察值的……累加:
Σ(Y-Ӯ)2=Σ(Y-Ӯt) 2 + Σ(Ӯt -Ӯ ) 2 +2 ( Ӯt - Ӯ ) Σ (Y - Ӯt) 〔= 0〕
第一节 方差分析原理
附表6 列出了各自由度对应的t 分布曲线 再按9 种秩次距修正出来的SSR分布当两尾 概率取0.05和0.01时临界值,记为SSR0.05和 SSR0.01,其中k =2的那一条因为实际就是 t 分布曲线压缩横坐标刻度所得, 所以表中列
顺序 Ӯt 27.96
A1 31.18 A4 27.96 A2 26.28 A3 24.74
= (155.9 2 +131.4 2 +123.7 2 +139.8 2 )/ 5 - 15169.03 = 114.27
于是SSe = SST- SSt = 199.67 -114.27 = 85.4 = SS1 + SS2 + SS3 +SS4 = 41.67 +5.43 +15.97+22.33
1、数据整理
C = T 2/nk = 265 2/25 = 2809 SST =ΣΣ(Y-Ӯ ) 2 = ΣΣY 2 -C
=82 +132 +……+132 -2809 = 136 dfT = nk - 1= 5 ×5 - 1 = 24
第二节 单向分组数据
2、平方和、自由度的分解
SSt = nΣ ( Ӯt-Ӯ ) 2 = Σ Tt 2 /n -C = 73.2 = (51 2 +41 2 +60 2 +48 2 +65 2 )/ 5 -2809 于是 SSe = SST- SSt = 136-73.2 =62.8
Ӯt-24.74 Ӯt-26.28 Ӯt-
6.44 ** 3.22 ns 1.54 ns
4.9 ** 1.68 ns
3.22 *
出的SSR0.05和SSR0.01就分别等于附表3所列 t0.05 和t0.01的√2 倍; 其它k≥3的SSR分布随 着P的递增, 对 t 分布的修正幅度加大, 因此
ν=16,k =2→ ν=16,k =3→
3 13 14 10 11 12 60 12 4 13 9 8 8 10 48 9.6 5 12 11 15 14 13 65 13
一、各组观察值个数相等
例5.2 抽测 5个不同品种(k = 5)各5 头母猪(n = 5)的窝产仔数,结果如右表 所示,T = 265,试检验不同品种的母猪 平均窝产仔数差异是否显著。
5
2 3.00 4.13 3.099 4.266
3 3.15 4.34 3.254 4.483
4 3.23 4.45
LSR0.05= SE ·SSR0.05
3.337 4.597
LSR0.01= SE ·SSR0.01
顺序 Ӯt Ӯt-24.74
A1 31.18 6.44 ** A4 27.96 3.22 ns A2 26.28 1.54 ns
ν=16,k =4→
3.自由度dfe决定, 并根据 两两差数秩次距“k”的不同而有所修正。如
↓ 3.00
↓
本例k = 2、3、4,测验时依据dfe=16的 t 分
A3 22.1 ……… 25.8 123.7 24.74 15.97
A4 27.0 ……… 28.5 139.8 27.96 22.33
再把全部处理观察值的……累加,得:
ΣΣ(Y-Ӯ )2=ΣΣ(Y-Ӯt) 2 + nΣ ( Ӯt-Ӯ ) 2 即: SST = (组内) SSe + (组间) SSt 其中 SSt = nΣ ( Ӯt-Ӯ ) 2 = Σ Tt 2 /n -C
dft = k - 1= 3 dfe= dfT - dft =19-3 = df1 + df2 + df3 +df4= 4 +4 +4+4 = 16
第一节 方差分析原理
三、列ANOVA表,进行F-test
变异来源 DF SS
MS F
F 0.01
处理 3 114.27 38.09 7.13 ** 5.29
Fisher’s protected multipe comparisons. 此前产生的复极差测验 (简称q-test、又 称SNK测验) 却可以不经过F-test, 原因 是q-test算LSRα时要改查q 值表(附表7), 所依据的q分布是按极差抽样分布原理 要保证各比较都是同一显著水平α, 因 而对 t 分布修正幅度随秩次距k的递增 而加大的速度要比SSR分布快, 所以秩 次距k≥3 时q0.05和q0.01 比相应的SSR0.05 和SSR0.01大。
A3 24.74
Ӯt-26.28 Ӯt-27.96
4.9 ** 3.22 * 1.68 ns
SE = 1.033
综合包括多重比较在内的方差分析 全过程,其原理可归纳为:
一个性质(SS、DF的可加性) 两个分布(F分布和SSR分布) 本例根据SSR分布进行的多重比较 叫新复极差测验, 简称SSR-test 。因为 不能缺少 F-test 显著的前提,属于
上升到26.5%( 即 “t0.05 ”= t0.265 )……以
此
类推……5个样本……40%以上。
第一节 方差分析原理
一、数据整理
饲料 鱼 的 增 重 (10g)
根据方差分析的先决条件,在“三个
Tt
Ӯt
SS
假定”成立的前提下,对右表继续整理: A1 31.9 ……… 35.9 155.9 31.18 41.67
S Ӯ1-Ӯ2 =√Se2 ( 1/n1 + 1/n2 ) = 1.70
t0.143)…
t =〔( Ӯ1- Ӯ2 ) -(μ1-μ2)〕÷ SӮ1- Ӯ2
继续以相同的容量每次抽四个样本,
= 6.44 ÷ 1.70 = 3.8 > “t0.05”=2.306
仍以Ӯ最大的和Ӯ最小的求算t 值, 则…… 的把由握于不撇到开8A0%、。B孤立地进行,否定HO
重要程度是否达到显著水平。
第一节 方差分析原理
四、多重比较 R.A.Fisher 创建的方差分析法并没有明确
(极)显著差异究竟存在于哪些 “组平均数” 之间, F值(极)显著所包含的信息只有通过 对C2n= k(k-1)/2个两两差数进行多次连续性
顺序 Ӯt Ӯt-24.74 27.96
A1 31.18 6.44 A4 27.96 3.22 A2 26.28 1.54 A3 24.74
dft = k - 1= 4 dfe= dfT - dft =24-4= 20
3、列ANOVA表,进行F-test
假设是Ho:σt2 ≤σe2 而不是Ho:σt2 =σe2
(和 Ho:μ1= μ2= μ3= μ4= μ5效果一样)
SOV DF SS MS F F 0.01 品种 4 73.2 18.3 5.83** 4.43
试验设计有几个可控因素, 数据就会有几种 可能的分组方式, 也就可以算出几个组间SS, 而 本属于组内SS的误差分量在平方和分解时总是 由SST 减去所有可控因素SS得到, 因此它又被称 为“剩余平方和”。
自由度的剖分与平方和的剖分一一对应。
㈡依据F分布进行整体测验; 只确定可控因素分量和误差分量的相对
第二节 单向分组数据
单向分组数据指观察值仅按一个方 向分组的数据。如例5.1中将全部供试单 品种 产仔数观察值(头) Tt Ӯt
位(试验材料)随机地分成若干组,然后
1 8 13 12 9 9 51 10.2
各组给以不同处理,即同组供试单位受 2 7 8 10 9 7 41 8.2
相同处理,不同组受不同处理,这样所 得的全部观察值在设计上称为完全随机 试验数据,而实际研究中下例5.2那样的 调查结果也属此类。
㈠平方和与自由度的可加性; SST 综合了全部观察值的变异量, 它汇总了
各变异来源 (SOV) 导致原始数据和全试验平均 数 ( Ӯ ) 出现差异的分量, 包括可控因素分量和 误差分量两类; “可加性” 证实前者就是观察 值按可控因素分组后算得的组间平方和 ( 可控 因素可以是试验因素, 也可以是象单位组那样 的其它系统因素 ) 。
测验才能完全揭露出来,这就是多重比较。
ν=16,k =2→
多重比较不论用哪一种方法, 区别于多 次孤立的 t-test 或者说体现其“连续性” 特征
ν=16,k =3→
Ӯt-26.28 Ӯt-
4.9
3.22
1.68
←SSR= t√2
之处有两个, 一是必须使用同一个共用的标 准误, 记为“SE”), 本例SE=√MSe / n = √5.34÷5 =1.033 (10g); 二是所依据的抽样分
A1 31.9 ……… 35.9 A2 24.8 ……… 26.2 A3 22.1 ……… 25.8
155.9 31.18 41.67 131.4 26.28 5.43 123.7 24.74 15.97
A4 27.0 ……… 28.5 139.8 27.96 22.33
比如本例针对药剂A1与药剂A3的两两差 数6.44 (最大Ӯ -最小Ӯ) 进行的t-test:
误差 20 62.8 3.14
总 24 136 4、多重比较
SE=√MSe / n =√3.14÷5 = 0.793
品种 产仔数观察值(头) Tt Ӯt
Y-Ӯ = (Y-Ӯt) + ( Ӯt -Ӯ ) 两边同时平方,得:
(Y-Ӯ )2 = (Y - Ӯt) 2 + ( Ӯt - Ӯ ) 2 +2 (Y - Ӯt) ( Ӯt - Ӯ )
由同一处理重复观察值的……累加:
Σ(Y-Ӯ)2=Σ(Y-Ӯt) 2 + Σ(Ӯt -Ӯ ) 2 +2 ( Ӯt - Ӯ ) Σ (Y - Ӯt) 〔= 0〕
第一节 方差分析原理
附表6 列出了各自由度对应的t 分布曲线 再按9 种秩次距修正出来的SSR分布当两尾 概率取0.05和0.01时临界值,记为SSR0.05和 SSR0.01,其中k =2的那一条因为实际就是 t 分布曲线压缩横坐标刻度所得, 所以表中列
顺序 Ӯt 27.96
A1 31.18 A4 27.96 A2 26.28 A3 24.74
= (155.9 2 +131.4 2 +123.7 2 +139.8 2 )/ 5 - 15169.03 = 114.27
于是SSe = SST- SSt = 199.67 -114.27 = 85.4 = SS1 + SS2 + SS3 +SS4 = 41.67 +5.43 +15.97+22.33
1、数据整理
C = T 2/nk = 265 2/25 = 2809 SST =ΣΣ(Y-Ӯ ) 2 = ΣΣY 2 -C
=82 +132 +……+132 -2809 = 136 dfT = nk - 1= 5 ×5 - 1 = 24
第二节 单向分组数据
2、平方和、自由度的分解
SSt = nΣ ( Ӯt-Ӯ ) 2 = Σ Tt 2 /n -C = 73.2 = (51 2 +41 2 +60 2 +48 2 +65 2 )/ 5 -2809 于是 SSe = SST- SSt = 136-73.2 =62.8
Ӯt-24.74 Ӯt-26.28 Ӯt-
6.44 ** 3.22 ns 1.54 ns
4.9 ** 1.68 ns
3.22 *
出的SSR0.05和SSR0.01就分别等于附表3所列 t0.05 和t0.01的√2 倍; 其它k≥3的SSR分布随 着P的递增, 对 t 分布的修正幅度加大, 因此
ν=16,k =2→ ν=16,k =3→
3 13 14 10 11 12 60 12 4 13 9 8 8 10 48 9.6 5 12 11 15 14 13 65 13
一、各组观察值个数相等
例5.2 抽测 5个不同品种(k = 5)各5 头母猪(n = 5)的窝产仔数,结果如右表 所示,T = 265,试检验不同品种的母猪 平均窝产仔数差异是否显著。
5
2 3.00 4.13 3.099 4.266
3 3.15 4.34 3.254 4.483
4 3.23 4.45
LSR0.05= SE ·SSR0.05
3.337 4.597
LSR0.01= SE ·SSR0.01
顺序 Ӯt Ӯt-24.74
A1 31.18 6.44 ** A4 27.96 3.22 ns A2 26.28 1.54 ns
ν=16,k =4→
3.自由度dfe决定, 并根据 两两差数秩次距“k”的不同而有所修正。如
↓ 3.00
↓
本例k = 2、3、4,测验时依据dfe=16的 t 分