第五章 方差分析(第一节)

合集下载

方差分析(1)

方差分析(1)

品 A B C D 合计 种 2 6 3 8.5
3 8 5 9.5
4 10 7 10.5
Tig 9 24 15 28.5 T.. 76.5
xi 3 8 5 9.5 x.. 6.4
一、线性模型与基本假定
线性模型 每个观察值的大小取决于两个方面的原因:处理 和误差。因此,任一观察值可分解为:
xij x.. (xi. x..) (xij xi.) x.. ti eij
其中 ti xi. x.. : N (0, 2 )
处理效应
eij xij xi. :
N
(0,
2 e
)
试验误差
一、线性模型与基本假定
线性模型 本例 xij x.. (xi. x..) (xij xi.)
2 6.4 (3 6.4)(2 3) 6 6.4 (8 6.4)(6 8)
然后判断品种间的差异显著性
方差分析的基本步骤
一、线性模型与基本假定 二、平方和与自由度的分解 三、方差的比较—F测验 四、平均数的比较—多重比较 五、方差分析的结论
方差分析的基本步骤
例5.1 现有四个水稻品种A、B、C和D,完全随机地种 在一个划分为12个小区的试验地中,每品种种了3个小 区。田间排列和小区产量如图7.1所示。欲了解这四个 品种的产量是否有显著差异。
第一节 方差分析的基本原理与步骤
方差分析的思路: 将总方差分解来研究
1. 将试验数据的总变异分解为各个原因变异 2. 比较各个原因变异的重要性 3. 判断各个样本所属总体平均数是否有显著差异
第一节 方差分析的基本原理与步骤
方差分析的思路: 将总方差分解来研究
1. 将试验数据的总变异分解为各个原因变异 2. 比较各个原因变异的重要性 3. 判断各个样本所属总体平均数是否有显著差异

5章 方差分析

5章 方差分析
检验或F检验,两个以上样本均数的比较只能用F检验。 2、回归方程的线性假设检验;
3、检验两个或多个因素间有无交互作用。
应用条件(P63)
1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差方差相等, 即方差齐。
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求;
H0:三种卡环抗拉强度的总体均数相等;各区组 卡环抗拉强度的总体均数相等
H1:三种卡环抗拉强度的总体均数不全相等;各 区组卡环抗拉强度的总体均数不全相等
0.05
2、计算F值
方差分析表
──────────────────────────
变异来源 SS
V
MS
F
──────────────────────────
2、如果方差分析无差别,分析结束。
多样本均数之间的多重比较
两两比较,又称基于方差分析的后续 检验(post hoc test)。
LSD-t检验和SNK检验
多个样本均数的比较一般分为两种情况:
①证实性实验研究:在设计阶段就根据研究目的或专业 知识决定某些均数间的两两比较,例如多个处理组与 对照组的比较,处理后不同时间与处理前的比较等。
MS组内 2

1 nA

1 nB

a 指样本均数排序后,比较的两组间包含的组数。
例5-3,SNK多重比较:
处理组
甲组
乙组
丙组
丁组
xi
ni
组次
0.2913 8 1
1.0200 8 2
2.1488 8 3
2.2650 8 4
S xA xB
MS组内 2

假设检验与方差分析

假设检验与方差分析
这是不合理的,应拒绝原假设。
三、假设检验的步骤
1、提出原假设(null hypothesis)和备择假设 (alternative hypothesis)
原假设为正待检验的假设:H0; 备择假设为可供选择的假设:H1 一般地,假设有三种形式:
(1)双侧检验:
H0 : 0; H1 :0 (2)左侧检验:
这两个例子中都是要对某种“陈述”做出判
断:
例1要判明工艺改革后零件平均 长度是否仍为4cm;
进行这种判断 的信息来自
例2要判明该批产品的次品率是 所抽取的样本
否低于3%。
所谓假设检验,就是事先对总体参数或总体分 布形式作出一个假设,然后利用样本信息来判断 原假设是否合理,即判断样本信息与原假设是否 有显著差异,从而决定是否接受或否定原假设
对比来构造检验统计量。
可以证明,若H0为真,则
2
(n 1)S 2
2 0
~
2 (n 1)
因此,可构造2 统计量进行总体方差
的假设检验。
当H0成立时,S2/02 接近于1,2的 值在一个适当的范围内,
当H0不成立时,S2/02远离1,2的值 相当大或相当小。
在例2中,由于所抽样本只为10,为小样本,因 此无法构造Z统 计量进行总体比例的假设检验。
如果总体X~N(,2),在方差已知的情况下,对总体均 值进行假设检验。
由于
因此,可通过构造Z统计量来进行假设检验:
注意: 如果总体方差未知,且总体分布未知,但如果是大样
本(n>=30),仍可通过 Z 统计量进行检验,只不过总体 方差需用样本方差 s 替代。
例3:根据以往的资料,某厂生产的产品的使用寿命服从正 态分布N(1020, 1002)。现从最近生产的一批产品中随机抽取16 件,测得样本平均寿命为1080小时。问这批产品的使用寿命 是否有显著提高(显著性水平:5%)?

医学统计:方差分析

医学统计:方差分析
研究目的是推断各样本所代表的总体均数是 否相等。
变异分解
单因素方差分析是把总变异的离均差平方 和与自由度分别分解成组间和组内 2 部分, 各部分的离均差平方和相互之间有以下关系
SS总 SS组间 SS组内
总 组间 组内
单因素方差分析的计算公式
变异来源
SS

MS
F
总变异
1122.68( x )
26( n )
43.18( x ) 56923.11( x 2 )
计算步骤
1.建立检验假设,确定检验水准
H0 :4 组家兔的血清 ACE 浓度总体均数相等, 1 2 3 4
H1 :4 组家兔的血清 ACE 浓度总体均数不等
或不全相等,各 i 不等或不全相等
称为均方差,简称均方(mean square,MS)。组
间均方和组内均方的计算公式为:
MS组间

SS组间
组间
MS组内

SS组内
组内
均方之比=F value
如果各组样本的总体均数相等(H0: 1 2 … k ),
即各处理组的样本来自相同总体,无处理因素的作用,则组 间变异同组内变异一样,只反映随机误差作用的大小。组间

372.592 6
229.172 191.002


484.77.3224
7
7
5515.3665
SS组内 SS 总 - SS 组间 8445.7876 5515.3665
2930.4211
计算步骤
总 n-1 26-1 25 组间 k 1 4 1 3
形形状,因此 F 分布可用 F (1, 2 ) 表示。以 F 为横轴, f (F) 为纵轴可绘制 F 分布的图形。

湖南大学-应用统计学 第五章 方差分析

湖南大学-应用统计学 第五章 方差分析

各yij间总的差异大小可用总偏差平方和 rm
ST
( yij y )2
i1 j 1
表示,其自由度为fT=n1;
仅由随机误差引起的数据间的差异可以用
rm组内偏差平方和来自Se ( yij

2
yi. )
表示,
i1 j 1
也称为误差偏差平方和,其自由度为 fe=nr ;
如今要对因子平方和 SA 与误差平方和 Se 之间进
行比较,用其均方和 MSA= SA /fA , MSe= Se /fe 进
行比较更为合理,故可用 F MSA SA / fA 作为
检验H0的统计量。
MSe Se / fe
25 June 2019
湖南大学
第五章 方差分析
第22页
定理2 在单因子方差分析模型 (3) 及前述符号 下,有
25 June 2019
湖南大学
第五章 方差分析
第2页
例1 在饲料养鸡增肥的研究中,某研究所提 出三种饲料配方:A1是以鱼粉为主的饲料, A2是以槐树粉为主的饲料,A3是以苜蓿粉 为主的饲料。为比较三种饲料的效果,特
选 24 只相似的雏鸡随机均分为三组,每 组各喂一种饲料,60天后观察它们的重量。 试验结果如下表所示:
25 June 2019
湖南大学
第五章 方差分析
第25页
常用的各偏差平方和的计算公式如下:
ST

r i 1
m j 1
yi2j

T2 n
SA

1 m
r i 1
Ti 2
T2 n
Se ST SA
(10)
一般可将计算过程列表进行。
25 June 2019

方差分析

方差分析
X i ~ N (i , 2 ), i 1,2,3,4
假设从总体中抽取容量为 n i 的样本: X i 1 , X i 2 ,..., X in , i 1,2,3,4
i
• 假设4个样本相互独立,则 X ij相互独立, 这里 4
n ni
i 1
• 提出假设:
H0 : 1 2 3 4
原假设等价于
H0 : 1 2 ... r 0
5.4
5.1.3. 统计分析
(一)假设检验 • 构造(5.4)的统计量。 n 1 记 X X ,
i
ni


j 1 ni j 1
i
ij
1 2 Si ni
(X
ij
Xi ) ,
2
i 1,2,...,r
分别为第i个总体的样本均值和方差。
——单因素方差分析数学模型
• 假设
H 0 : 1 2 ... r
• 引入记号: n ni(总次数)
i 1 r
1 r ni i n i 1
(理论总均值)
i i
(因素对指标的效应)

i 之间的差异等价于 i 之间的差异,

n
Tests of Between-Subjects Effects Dep endent Variable: 杀 虫率 Source Corrected Model Intercept 农药 Error Total Corrected Total Type III Sum of Squares 3794.500a 95340.115 3794.500 178.000 118693.000 3972.500 df 5 1 5 12 18 17 Mean Square 758.900 95340.115 758.900 14.833 F 51.162 6427.424 51.162 Sig . .000 .000 .000

第5章 方差分析

第5章 方差分析

F检验
若实际计算的F值大于 F 0 . 0 5 ( d f , d f ) ,则 F 值在 α=0.05的水平上显著,我们以95% 的可靠性推断 2 2 St代表的处理间方差大于Se 代表的处理内方差。
1 2
这种用F值出现概率的大小推断两个总体方差 是否相等的方法称为 F检验。
F检验时,是将由试验资料所算得的F值与根 ,F 据df1=dft 和df2=dfe查表所得的临界F值F 相比较作出统计推断的。
1 1
k
n
x ) n (x i x )
2 2 1
k
(x
1 1
k
n
xi )
2
上式可简写成:SST=SSt+SSe 分别表示总 平方和,处理间平方和,处理内平方和。 即:总平方和=处理间平方和+处理内平
方和。
C=T2/kn:
SST

x C
2
1 2 SS t Ti C n SS e SS T SS t
P ( F F ) 1 F ( F )
F


f (F )d F
F表列出的是不同df1和df2下, P(F≥Fα)=0.05和P(F≥Fα)=0.01时的F值, 即右尾概率α=0.05和α=0.01时的临界F 值,一般记作F0.05(df1,df2), F0.01(df1,df2) 。
所以 d f T d f t d f e 综合以上各式得:
df T kn 1 df t k 1 df e df T df t
均方差,均方(mean square,MS)
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方 (mean square , MS )。组 间均方和组内均方的计算公式为 :

田间统计第5章_方差分析(第1节)

田间统计第5章_方差分析(第1节)

在计算处理内平方和时,kn个离均差
( xij xi ) 要受k个条件的约束,即
(x
j 1
n
ij
xi ) 0 (i=1,2,…,k)
故处理内自由度为资料中观测值的总个数
减 k ,即 kn - k 。 处理内自由度记为 dfe
dfe=kn-k=k(n-1)
因为
nk 1 (k 1) (nk k ) (k 1) k (n 1)
F 分布密度曲线是随自由度df1、df2的
变化而变化的一簇偏态曲线,其形态随着df1、 df2的增大逐渐趋于对称,如图3-15所示。

特点:1、F分布的平均数μ F=1; 2、取值范围[0,+∞]; 3、只有一尾概率,右尾概率; 4、F分布是一组曲线系,当V1、V2都 趋近于+∞时,F分布趋于对称分布。
(二)、F检验
用 F 值出现概率的大小推断一个总
体方差是否大于另一个总体方差的方法
称为F检验(F-test)。F检验是一尾检验。
对于单因素完全随机设计试验资料的方差
分析:
无效假设H0:μ1=μ2=…=μk
备择假设HA:各μi不全相等 或 假设 H0:σt2=σe2 对 HA:σt2﹥σe2, F=MSt / MSe,也就是要判断处理间均方
j
Hale Waihona Puke LSDa t a ( dfe ) S xi x j
t ( df e ) 为在F 检验中误差项自由度下,显著水平
为α的临界t 值, S x x 为均数差数标准误, i j
S xi x j
2MS e / n
MS e 为F 检验中的误差均方,n为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Copyright © 2008 Sichuan Agricultural University All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
方差分析的线性数学模型
• 方差分析的数学模型就是指试验资料的数
田间试验与统计分析
Field Experiment and Statistical Analysis
总变异:dfT nk 1
nk 1 (k 1) (nk k ) (k 1) k (n 1)
dfT df t df e
df t k 1, df e k (n 1)
因为 MSe 是σ2 的无偏估计量, MSt

n
2
2 的无偏估计量,所以
为2
MSe的数学期望(mathematical
2 expectation), n 2 为MSt的数学
期望。又因为它们是均方的期望值
(expected value),故又称期望均方,
简记为EMS(expected mean squares)。
田间试验与统计分析
Field Experiment and Statistical Analysis
第一节
方差分析的基本原理与步骤
一、线性模型与基本假定 二、自由度与平方和的分解 三、F检验 四、多重比较 五、单一自由度的正交比较*
Copyright © 2008 Sichuan Agricultural University All Rights Reserved
Copyright © 2008
Sichuan Agricultural University
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
• 其中SSi、dfi(i=1,2,…ቤተ መጻሕፍቲ ባይዱk)分别表示由试验
资料中第i个 处理的n个观测值算得的平方 和与自由度。这就是说,处理内均方MSe是 误差方差的无偏估计量。
i
)间的差异,二是本身的
所计算的处理间均方MSt实际上是 的无偏估计量。
Copyright © 2008 Sichuan Agricultural University
n
n
2
2
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
n
k
n
( xij x ) [( xi x ) ( xij xi )]2
2 i 1 j 1 i 1 j 1
k
n
k
[( xi x ) 2 2( xi x )( xij xi ) ( xij xi ) 2 ]
Field Experiment and Statistical Analysis
2 • 显然,各 S 的合并方差 S(以各处理内 e 的自由度n-1为权的加权平均数)也是σ2的 无偏估计量,且估计的精确度更高。很容 2 易推证处理内均方MSe就是各 S的合并。 i
2 i
SSe MSe df e
i 1 j 1 k
k
n
n ( xi x ) 2 ( xi x ) ( xij xi ) ( xij xi ) 2
2 i 1 k i 1 j 1 i 1 j 1
k
n
k
n
n ( xi x ) ( xij xi ) 2
田间试验与统计分析
Field Experiment and Statistical Analysis
一、线性模型与基本假定 • 假设某单因素试验有k个处理,n次重 复,完全随机设计,则共有nk个观察 值,其数据结构和符号如表5.1。
• 每个观察值可用如下数学模型表示:
xij i ij
Copyright © 2008
Sichuan Agricultural University
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
自由度和平方和的简便计算公式
2 k n x 2 SST xij nk i 1 j 1 2 1 k 2 x 平方和:SS t xi n i 1 nk SS SS SS T t e
Copyright © 2008
Sichuan Agricultural University
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
• 试验中各处理所属总体的本质差异体现在处
理效应
i
的差异上。我们把
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis

(i=1,2,…,k)表示第i个处理观测值
2 i
总体的方差。如果所分析的资料满足这 个方差同质性的要求,那么各处理的样 本方差 S , S ,, S
2 1 2 2 2 k
田间试验与统计分析
Field Experiment and Statistical Analysis
三、F检验
• 方差分析的一个基本假定是要求各处理观
测值总体的方差相等,即

2 1 2 2 2 k
2
Copyright © 2008
Sichuan Agricultural University
xij x .. ( xi . x ..) ( xij xi .) x .. ti eij
Copyright © 2008
四川农业大学生物统计课程组 Sichuan Agricultural University
Dr. 刘永建 All Rights Reserved
田间试验与统计分析
Copyright © 2008 Sichuan Agricultural University All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
2 当处理效应的方差 =0,亦即各处理
观测值总体平均数μ i(i=1,2,…,k)相等时, 处理间均方MSt与处理内均方一样,也是误差
ai2 k 1

( i ) 2 k 1
称为效应方差,它也反映了各处理观测值总体 平均数的变异程度,记为 。
2
k 1
2 a 2 i
Copyright © 2008
Sichuan Agricultural University
All Rights Reserved
方差σ2的估计值。
Copyright © 2008
Sichuan Agricultural University
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
方差分析就是通过MSt 与MSe的比较来推 2 断 是否为零即 i 是否相等。统计学已证 2 明,在 =0的条件下,服从自由度df1=k-1 与df2=k(n-1)的F分布。即
dfT nk 1 自由度:df t k 1 df df df T t e
SSt SS e SST MST , MS t , MS e dfT df t df e
Copyright © 2008 Sichuan Agricultural University All Rights Reserved
x ij i ij

x ij 表示为总平均数μ、处理效应α 、试验
误差εij 之和。由εij相互独立且服从正态分布 N(0,σ2),可知各处理Ai(i=1,2,…,k) 所属总体亦应具正态性,即服从正态分布 N(μi,σ2)。尽管各总体的均数可以不等或相 等,σ2则必须是相等的。
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
• 这是因为处理观测值的均数间的差异实际上
包含了两方面的内容:一是各处理本质上的
差异即 i(或
(xi x)2 抽样误差。统计学上已经证明, 2 k 1 2 是 的无偏估计量。因而,我们前面
据结构或者说是每个观察值的线性组成部 分,它是进行方差分析的基础。
Copyright © 2008
Sichuan Agricultural University
All Rights Reserved
田间试验与统计分析
Field Experiment and Statistical Analysis
Field Experiment and Statistical Analysis
• 所以,单因素试验的数学模型可归纳为: 效应的可加性(additivity)、分布的正 态性(normality)、方差的同质性 (homogeneity)。 • 这也是进行其它类型方差分析的前提或 基本假定。
Copyright © 2008
(xij xi )2 k (n 1)
SS1 SS2 SSk k (n 1) df1 df 2 df k
相关文档
最新文档