第九章+方差分析

合集下载

第九章方差分析

第九章方差分析

四、方差分析中的符号



K=处理条件或组数 n或nj =每一个组的被试数 N=总被试数
方差分析的符号
X或X ij 各组的每一个原始得分 X 或 X j 各组的平均分 X T 总平均分
X 或 X 各组数据求和
i 1
n
X或 X 所有组数据求和
j 1 i 1
k
n
五、方差分析的基本原理:综合的F检验 (一)综合虚无假设 (二)方差的可分解性
六、方差分析的基本过程与步骤
平方和
自由度 均方 F值 查F值表进行F检验并做出决断 方差分析表
七、方差分析的基本假定
八、方差分析中的方差齐性检验 九、与方差分析有关的实验设计问题
在B2水平上,A1与A2均值差异的F检(A的主效应)
方差分析与两样本平均数t、Z检验有何异同?
t、Z-test 方差分析 相同点 平均数差异显著性检验、总体呈正态或近似正态分布、 各组方差齐性、等距或等比数据 不同点 一个或两个平均数差异检验 多个平均数差异检验 利用平均数的差 利用平均数的方差与误 差方差 利用统计量F 利用统计量t、 Z
第二节 单因素完全随机设计的方差分析
一、各实验处理组样本容量相同
二、各实验处理组样本容量不同
三、利用样本统计量进行方差分析
第三节 单因素随机区组设计的方差分析 一、单因素随机区组设计的基本模式
二、单因素随机区组设计的方差分析过程
三、单因素重复测量实验设计的方差 分析
第四节 多因素完全随机设计的方差分析
三、方差分析中的几个概念 因素:实验的自变量。
单因素、二因素、多因素
水平:某一因素的不同情况。 处理:由因素与水平构成的各种组合情况。

第九章(一)方差分析

第九章(一)方差分析

nj
r
nj
2 ( X ij X j )( X j X )
j 1 i 1
nj
数理统计
续(三个平方和的关系)
由于
2 ( X ij X j )( X j X ) 2 ( X j X ) ( X ij X j )
j 1 i 1 j 1 r i 1 r nj r nj
是否成立。而备选假设则为
H1 : 1 , 2 , 3
和4 不全相等
3.上述假设的检验方法就是方差分析
数理统计
二、方差分析原理 1.两类误差及两类方差
⑴.每个水平为一个总体;
⑵.每个水平的一组观察值为总体的一个随机样本, 同一水平下样本观察值之间的差异称为随机误差,用组内 方差来表示; ⑶.不同水平下样本观察值之间的差异可能是由于不
问饮料的颜色是否对销售量产生影响。
表 9-1 超市 1 2 3 4 5 该饮料在五家超市的销售情况 无色 26.5 28.7 25.1 29.1 27.2 粉色 31.2 28.3 30.8 27.9 29.6 橘黄色 27.9 25.1 28.5 24.2 26.5 单位:箱 绿色 30.8 29.6 32.4 31.7 32.8
同水平引起的,这种误差称为系统误差,但也包含随机误
差。不同水平样本观察值之间差异用组间方差来表示,即
组间方差包括随机误差,也包括系统误差。
数理统计
2.方差的比较
⑴.如果不同水平对试验结果没有不同影响,那么组 间方差中只包括随机误差,这时,组间方差与组内方差应 该相近,组间方差与组内方差之比接近 1; ⑵.如果不同水平对试验结果有不同影响,那么组间 方差除了随机误差之外还包括系统误差,这时,组间方差 就会大于组内方差,组间方差与组内方差之比就会大于 1; ⑶.方差分析就是通过这种方差的比较,作出接受原 假设或拒绝原假设的判断。

第九章 方差分析

第九章  方差分析

第九章方差分析前面介绍了两个样本均数比较的t检验,那么多个样本均数的比较应该采用什么方法?方差分析(analysis of variance, ANOV A)是20世纪20年代发展起来的一种统计方法,由英国著名统计学家R.A.Fisher提出,又称F检验,是通过对数据变异的分析来推断两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

本章首先介绍方差分析的基本思想和应用条件,然后结合研究设计类型分别介绍各类方差分析方法。

第一节方差分析的基本思想和应用条件一、方差分析的基本思想方差分析的基本思想是把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

例9.1 为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。

喂养一周后,测定大鼠红细胞数(×1012/L),试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?表9.1 喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料合计X 4.78 4.65 6.80 4.65 6.92 5.913.984.447.284.04 6.167.51 3.445.997.51 3.776.677.743.65 5.298.194.91 4.707.154.795.058.185.316.01 5.534.055.677.795.16 4.688.03in12 12 12 36 (n)i X ∑ 52.53 66.23 87.62 206.38(X ∑)i X4.385.52 7.30 5.73 (X ) 2i X ∑ 234.2783373.2851647.73121255.2946(2X ∑)表9.1按完全随机设计获得的36个数据(X )中包含以下三种变异: 1. 总变异 36只大鼠喂养一周后测定红细胞数X 各不相同,即X 与总均数X 不同,这种变异称为总变异(total variation)。

第九章 方差分析ppt课件

第九章 方差分析ppt课件
SSW/dW f MW S 14.71/5 1 9410 .4111
(3)计算F值。
精选PPT课件
18
(4) 确定显著性水平和F临界值 取α=0.05,查F分布表得 F0.05(3,14) 3.34。由于计
算的F=3.52> F0.05(3,14) 3.34,P<0.05,所以拒绝原假
设,接受备择假设,认为各组平均数中至少有一对不
精选PPT课件
25
计算自由度: dBfk 14 13;
dW fk n k4 5 4 1;6
df T df B df W =16+3=19
求均方:
MS B
SS B df B
370122.3 3

MSW
SSW dfW
35622.25 16
(3)计算F值:
FMBS12.325.50 MW S 22.25
1、提出假设 2、计算平方和与自由度 3、计算F值 4、确定显著性水平并查F临界值表 5、列方差分析总表
精选PPT课件
3
一、方差分析的逻辑思想
1、方差分析是一种综合的检验方法
方差分析是对引起方差变化的各种因 素进行统计分析,检验引起各样本差异 的主要原因(或因素),并与理论值比 较,以判断其显著性。
首先将总体变异分解成样本组间变异 和由抽样误差等其它原因产生的组内变 异,然后分析变异各组成部分的关系。
如果样本组间变异比抽样误差等其它 原因产生的变异显著地大,则认为样本 组间有本质性的差异,否则,认为样本 组间无本质差异。
精选PPT课件
6
在方差分析中,观测值之间的差异情 况用离差平方和表示,符号为SS。方差分析首先 是把总体平方和分解为组间平方和和组内平方和, 即:

第九章 方差分析

第九章  方差分析

第九章方差分析方差分析是从方差的角度,研究各有关因素对试验结果影响大小的有效方法.从数理统计的角度来看,方差分析是通过比较总体方差的各种估计量之间的差异,来分析等方差的正态总体是否具有相同的均值.称之为方差分析的原因,是在显著性检验中所用统计量的分子、分母都是总体方差的估计量.试验中,将要考察的指标称为试验指标或响应值,试验指标值的全体构成我们所关注的总体;影响试验指标的条件称为因素,因素所处的状态称为该因素的水平.如果试验仅考虑一个因素,则称为单因素试验,否则称为多因素试验.可能有多个因素影响试验指标,但总是取少数重要因素进行研究.在方差分析中,通常取1-3个因素进行研究.因素的水平可以是数量化的,也可以是定性的.例如要研究几个不同的小麦品种间产量的差异时,考虑的因素是品种,而每个水平便是一个小麦品种,是定性的水平;而在研究氮肥施用量对小麦产量的影响时,水平(氮肥施用量)则是数量化的.方差分析只研究各个水平对试验指标的影响是否显著,并不给出各水平的影响程度.因此,方差分析是定量地估计各因素对试验指标的影响的工具.9.1 单因素方差分析先看一个实例.例1 在饲养条件尽可能相同的条件下,检验某种激素对羊羔增重的效应.选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复试验,则共需要16只羊羔.一种常用的试验方法,是将16只羊羔随机分配到16个试验单元.这种方法被称为完全随机设计,在试验单元间的试验条件很一致的情况下,这种设计最为有效.经过200天的饲养后,各羊羔的增重数量(单位:kg)见表9.1.表9.1 各羊羔的增重数量(kg/每头/每200d)- 204 -- 205 -本例中,试验指标是羊羔的增重数量,只有1个因素——激素,为单因素试验.激素的4个剂量(含对照)构成因素的4个水平.单因素方差分析用于分析单因素试验中,各个水平对试验指标的影响是否显著.为叙述单因素方差分析问题,再看一个实例.例 2 一批由同种原料织成的同一种布,用不同染整工艺处理,然后进行缩水率试验,考察染整工艺对缩水率的影响,在其它条件尽可能相同时,测得缩水率(%)如表9.2所示.的染整工艺处理后,缩水率的全体构成的集合,假定2~(,)X N μσ.所考察的因素是染整工艺A ,5种不同的染整工艺A 1,A 2,…A 5为因素的5个水平,假定水平i A 下的样本来自相互独立且等方差的正态总体2~(,)(1,2,5)i i X N i μσ= ,它们都是总体X 的特款.就该批布中的任意4块分别考察5个水平上的缩水率,看作是4次重复试验.令i i αμμ=-,则αi 反映了水平A i 对缩水率的影响.由于x ij 是来自2~(,)i i X N μσ的样本,于是i j i i j i i j x μεμαε=+=++ (i =1,2,…,5;j =1,2,…,4).这里,εij 表示观测过程中各种随机影响引起的随机误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.考察五个水平对缩水率的影响是否差异显著,即要检验假设012345:0H ααααα===== (9.1)一般地,设总体2~(,)X N μσ,因素A 有k 个水平A 1,A 2,…,A k .今对第i 个总体进行n i 次重复观测(i =1,2,…,k ),得到表9.3中的观测数据.- 206 - 表9.3 单因素方差分析数据表假定水平i A 下的样本来自相互独立、方差相同的正态总体2~(,)i i X N μσ(1,2,)i k = .令i i αμμ=-,则αi 反映了水平A i 对试验指标的影响.于是有i j i i j i i j x μεμαε=+=++(1,2,,;1,2,,)j i k j n == (9.2)其中,εij 表示试验观测过程中各种随机影响引起的误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.称(9.2)为单因素方差分析的数学模型.令n = n 1 + n 2 + … + n k , (9.3)表示观测数据总数,不难证明111,0.kki i ii i n n μμα====∑∑单因素方差分析是要考察各个水平对试验指标影响的差异是否显著.因此,要检验的统计假设为012:0k H ααα==== (9.4)即检验观测数据x ij 是否来自k 个相同的总体.记11,in i ij i i j ix x x x n ⋅⋅⋅===∑, (9.5) 1111,in kkij i i j i x x x x x n⋅⋅⋅⋅⋅======∑∑∑, (9.6) 则i x ⋅为总体A i 的样本均值,x 为总样本的均值.(9.5)式与(9.6)式中的圆点表示已经求过和的指标,下同.令211()in k t ij i j S x x ===-∑∑, (9.7)211()in ke ij i i j S x x ⋅===-∑∑, (9.8)- 207 -21()kA i i i S n x x ⋅==-∑. (9.9)称S t 为总离差平方和,它反映了观测数据总的变异程度;显然,i x ⋅是i μ的无偏估计,又ij ij i x εμ=- ,于是ij ij i e x x ⋅=-是误差εij 的无偏估计.因此,称S e 为误差平方和或组内平方和,它反映了随机误差εij 对试验指标影响的总和;S A 是水平i A 的平均i x ⋅与总平均x 的离差平方和,其中系数i n 是对水平i A 上观测次数的体现.因此,A S 反映了因素A 的各水平i A 的均值间的差异程度,称A S 为因素平方和或组间平方和.由于2112112211111122111111()[()()]()2()()()()()2()()(ii ii iiiin kt ij i j n kij i i i j n n n kk k ij i ij i i i i j i j i j n n n kk kij i i i ij i i j i j i j i S x x x x x x x x x x x x x x x x x x x x x x x ==⋅⋅==⋅⋅⋅⋅======⋅⋅⋅⋅=======-=-+-=-+--+-=-+-+--=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑221111)()iin n kkj i i i j i j x x x ⋅⋅====-+-∑∑∑∑于是有平方和分解公式:S t =S A +S e . (9.10) 其意义在于将因素平方和S A 与误差平方和S e 从总平方和S t 中分解出来.在各ij ε相互独立地服从N (0,σ2)分布的前提下,当假设(9.3)成立时,模型(9.2)变为i j i j x με=+(1,2,,;1,2,,)i i k j n == (9.11)即所有观测数据来自同一正态总体N (μ, σ2) ,于是由第六章(6.10)式知22/~(1)t S n σχ-.令21(),1,2,,in i ij i j S x x i k ⋅==-=∑- 208 -则/(1)i i S n -是来自总体i X 的样本方差,于是2/i S σ服从自由度为1i n -的χ2分布.而S e /σ2 =(S 1 + S 2 + …+S k ) /σ2,由12,,,k X X X 的独立性假定,知S 1,S 2,…,S k 相互独立.由χ2分布的可加性,知22/~()e S n k σχ- (9.12)至于A S 的分布性质,我们不假证明地给出如下定理: 定理1 (1) A S 与e S 相互独立;(2) 当假设(9.4)成立时,22/~(1)A S k σχ-.若用t f ,A f ,e f 分别表示t S ,A S ,e S 的自由度,由上述讨论得到t A e f f f =+ (9.13)称(9.13)为自由度分解公式.为了检验假设(9.4),取)/()1/(k n S k S F e A --=(9.14)当假设(9.4)成立时,由(9.12)及定理1,有~(1,)F F k n k -- (9.15)给定显著性水平α(0<α<1),查F 分布表得到自由度为(k -1, n -k )的F 分布临界值F α(k -1, n -k ),从样本算出F 统计量的值F 0,据F 0的大小作如下推断:若F 0 >F α(k -1, n -k )则拒绝假设(9.4),认为某些水平(并非全部)对试验指标的影响有显著差异;若F 0 ≤F α(k -1, n -k )则接受假设(9.4),认为各水平对试验指标的影响无显著差异.通常将单因素方差分析过程归结为如表9.4所示的单因素方差分析表. 为简化计算,还可以对所有观测数据同时加、减或同时乘、除一个非零常数.不难证明,对所有观测数据x ij 同时加、减一个任意常数不影响各平方和的值,同时乘、除以一个非零常数不影响F 统计量的值.即对原始数据x ij 做变换,0ijij x ax b a '=+≠后再进行方差分析,其结果不变.1 23 4计算得到:S A = =208,S e = 646,S t = S A + S e = 854.S A的自由度为k―1=3,S e的自由度为n―k =12.据此,列方差分析表如表9.5.由(9.13)式算出的F值为1.2879,查表得临界值F0.05(3,12)=3.49,从样本算出的F值1.2879远比5%显著水平要求的F值3.49小,因此认为各个处理间没有显著差异.值得注意的是,这并不证明4个处理间没有差异,可能存在真实的差异,但是在所选取的概率水平上,试验没有足够的灵敏度,未能检测出差异.单因素方差分析可在表(9.3)上计算.现对例2进行表格化计算.为便于计算,将表9.2中的各观测数据同减去5,在表9.6中表格化计算(9.14)和(9.15)式右端各项.注意到k i- 209 -- 210 -55.54,34.37,A e S S ==89.91.t A e S S S =+= 据此得到如表9.7所示的方差分析表.0.01F =6.07>4.89,故拒绝假设(9.1),认为染整工艺对缩水率的影响极显著.在方差分析中,仍用* *表示极显著(a≤0.01时显著),用*表示0.01<a≤0.05时显著.在单因素方差分析中,各水平上观测次数n 1,n 2,…,n k 可以不相等.但在实际问题中,多取n 1 = n 2 =…n k ,因为选择同样大小的样本有如下优点:(1)与方差相等的假设的偏离不会过大,方差相等的检验比较容易;(2)F 检验时出现的第二类错误变小;(3)均值的其它比较(参阅§9.3)较为简单.9.2 双因素方差分析在双因素方差分析中,假定试验指标受两个变异因素A 、B 的影响,并假定行因素A 有m 个水平A 1,A 2,…,A m ,列因素B 有r 个水平B 1,B 2,…,B r .在每对组合水平(A i , B j )上做一次试验,得到m ×r 个试验结果x ij (i =1,2,…,m ; j =1,2,…,r ).所有ij x 独立,实验数据见表9.8.假定总体2~(,)X N μσ,2~(,)ij ij x N μσ,则11m rij i jmr μμ==∑∑ (9.16) 再假定组合水平(A i , B j )下的效应可以用A i 下的效应i α和B j 下的效应j β之和来表示,即ij i j μμαβ=++其中- 211 -110,0mriii j αβ====∑∑(正负效应相互抵消). 表9.8 双因素方差分析观测数据表1111,,r m A Biij j ij j i r m μμμμ====∑∑则A i μ和B j μ分别表示水平i A和j B 上的总体均值,且有 ,A i i αμμ=-.B j j βμμ=-类似于单因素方差分析,可将双因素方差分析的线性模型表示为(1,2,,;1,2,,)ij i j ij x i m j r μαβε=+++== . (9.17)这里,εij 表示其它随机因素引起的随机误差,εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.双因素方差分析的检验假设为01120212:0(9.18):0(9.19)m r H H αααβββ====⎧⎨====⎩仍用n = m ×r 表示观测数据总数,记11,(1,2,,)ri ij i i j x x x x i m r ⋅⋅⋅====∑ (9.20)11,(1,2,,)mj ij j j i x x x x i r m⋅⋅⋅====∑ (9.21) 111,m rij i j x x x x n⋅⋅⋅⋅====∑∑ (9.22)- 212 - 21()mA i i S r x x ⋅==-∑ (9.23)21()rB j j S m x x ⋅==-∑ (9.24)211()mre ij i j i j S x x x x ⋅⋅===--+∑∑ (9.25)211()mrt ij i j S x x ===-∑∑ (9.26)则i x ⋅为水平A i 上的样本平均,j x ⋅为水平B j 上的样本平均,x 为总体平均.S A 是因素A 的水平A i 上的样本平均i x ⋅与总体平均x 的离差平方和,若因素A 对响应值影响显著,则至少有一个离差平方(i x ⋅-x )2 较大,从而S A 较大;而当因素A 的影响不显著时S A 较小.因此,S A 反映了因素A 对试验结果的影响.同样,S B 反映因素B 对试验结果的影响.将模型(9.17)写成μμμμμμμμε+--=-+-+-=Bj A i ij B j A i ij ij x x )]()([于是,ij ij i j e x x x x ⋅⋅=--+是εij 的估计值.因此,S e 为误差平方和,它反映了其它随机因素对试验结果的影响.通过简单的推导可以证明下列平方和分解公式:S t = S A + S B + S e , (9.27)定理 2 (1) A S ,B S ,e S 相互独立,且()22/~(1)(1)e S m r σχ--,()22/~1t S mr σχ-;(2) 当假设01H 成立时,22/~(1)A S m σχ-; (3) 当假设01H 成立时,22/~(1)A S m σχ-; 证明略.若用t f ,A f ,B f ,e f 分别表示t S ,A S ,B S ,e S 的自由度,则由定理2得到- 213 -t A B e f f f f =++ (9.28)称(9.28)为自由度分解公式.由定理2,有()/(1)~1,(1)(1)/(1)(1)A A e S m F F m m r S m r -=----- (9.29)显然,F A 越大说明因素A 对试验结果的影响越大.对给定的显著性水平α,查F 分布表得自由度为(m ―1, (m ―1)(r ―1))的F 分布临界值F α,若从样本由(9.29)式算出F A >F α,则拒绝假设H 01,认为因素A 对试验结果有显著影响;否则认为因素A 的影响不显著.类似地,可使用统计量()/(1)~1,(1)(1)/(1)(1)B B e S r F F r m r S m r -=----- (9.30)对因素B 进行显著性检验.若从样本由(9.30)式算出F A >F α,则拒绝假设H 02,认为因素B 对试验结果有显著影响;否则认为因素B 的影响不显著.上述讨论可归结为如表9.9所示的方差分析表.表9.9 双因素方差分析表例3 将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区.有四个品种的小麦,在每一地块内随机分种在四个区上,每小区的播种量相同,测得收获量如下表(单位:kg ),试以显著性水平α1=0.05, α2=0.01考察品种和地块对收获量的影响是否显著.解 为计算简单起见,每一收获量均减去32,列表计算.- 214 -注意到m =4,r =5,n =20,经计算得到S A = 134.65, S B = 14.10, S t = 175.03, S e = 26.28,查表得临界值F 0.05(4, 12)=3.26,F 0.01(3, 12)=5.95.由于F B <F 0.05(4, 12),故认为地块不同对收获量无显著影响.由于F A >F 0.01(3, 12),故认为品种不同对收获量影响极显著.9.3 多重比较当假设(9.4)被拒绝后,只能表明在显著水平α下,至少有两个子体的均值间差异显著,并不表示k 个均值之间两两的差异都显著.通常要进一步检验该因素在各水平上的均值两两之间的差异是否显著,以确定哪些水平对响应值有重要影响.我们称这种差异性检验为多重比较.多重比较的方法很多,而且每种方法都有各自的优、缺点.这里,我们介绍适用范围较广的两种方法.一种是Scheffe 方法(S 法),另一种是Tukey 方法(T 法).在进行所有两个均值的同时比较时,如果每次比较的冒险率(犯第一类错误的概率)为α,则S 法和T 法全体冒险率均为α.如果用t 检验进行所有两个均值的同时比较,当均值个数大于2时,尽管每拒绝1个假设所犯的错误都是α,但同时拒绝2个假设所犯的错误是221(1).ααααα+-=-->如果对7个均值进行两两比较,要比较2721C =次.给定拒绝每个假设(i j μμ=,- 215 -1≤i <j ≤7)的冒险率0.10α=,要拒绝所有21个假设,即判明7个均值互不相等所犯的错误将是211(1)0.89α--≈!显然,在使用t 检验进行所有两个均值的同时比较时,全体的冒险率随均值个数的增加而增加.因此,t 检验只能适用于随机抽出的两个均值的比较,并不适用于所有的两个均值的同时比较. 9.3.1 S 法仍用e f 表示误差平方和S e 的自由度,/e e e MS S f =表示均方误差,假定观测数据满足方差分析的基本要求.在单因素方差分析中,Scheffe (1953)给出用于检验假设H 0:μi = μj (1≤i <j ≤k )的统计量i j D S α= (9.31)其中),1()1(e f k F k S --=αα.当||i j i j x x D ->时,则拒绝假设H 0 :μi =μj ,认为水平A i 与水平A j 在显著水平α下差异显著;否则认为A i 与A j 差异不显著.对于双因素方差分析,我们可以分别对每个因素作单因素方差分析,进而进行多重比较.也可以按下述步骤进行近似的S 检验:1 若检验假设A j A i H μμ=:0,则使用统计量ij D S = (9.32) 其中),1()1(e a f m F m S --=α.当||i j ij x x D ⋅⋅->时,则拒绝A j A i H μμ=:0,否则接受H 0.2 若检验假设B j B i H μμ=:0,则使用统计量ij D S α= (9.33) 其中),1()1(e f r F r S --=αα.- 216 - 当||i j ij x x D ⋅⋅->时,则拒绝B j B i H μμ=:0,否则接受H 0.比如在例2中,k = 5, n 1 = n 2 = … = n 5 = 4, f e = 15, MS e = 2.29.取α=0.05,查表得F 0.05(4,15)=3.06.于是由(9.32)及(9.33)得24.1206.34205.0=⨯=S ,)51(74.3)4141(29.224.12≤<≤=+⨯⨯=j i D ij .12||0.025 3.74x x -=<,故μ1与μ2差异不显著. 15|| 3.925 3.74x x -=>,故μ1与μ5差异不显著.14|| 3.35 3.74x x -=<,但与临界值3.74较接近,虽在显著水平0.05下认为μ1与μ4差异不显著,却能看出二者间存在真实的差异.类似地,可对其中任二均值进行比较. 9.3.2 T 法在用T 法进行k 个水平上的均值μ1,μ2,…,μk 之间的两两比较时,要求各水平上的重复数相同,即n 1 = n 2 = … = n k ,并且还要求2cov(,),,1,2,,;i j x x b i j k i j σ==≠ .即i x 与j x 的协方差不依赖于i 和j .T 法所使用的统计量是(,e T q k f α= (9.34) 其中(,)e q k f α是自由度为(,)e k f 的t 化极差分布的上侧α分位点.(,)e q k f α可以从“多重比较的q 表”中查到.S 法无论水平重复数是否相同都适用,T 法只适用于水平重复数相同的情况;在进行所有均值间的两两比较时,T 法比S 法灵敏度高,能检出较小的差异.因此,在水平重复数相同时应当用T 法.9.4 双因素等重复试验的方差分析在双因素试验中,除考察因素A 和B 对试验结果的影响外,还应考虑A 、B- 217 -的各水平的搭配情况对试验结果的影响,称此为A 与B 的交互作用,并把它设想为某一因素,记为A B ⨯.为考虑交互作用A B ⨯,对因素A 、B 的各水平的每一搭配(A i ,B j )都进行l (l ≥2)次重复观测,得到表9.10中的观测数据.表9.10 双因素等重复试验数据记n mrl =,1111m r lijk i j k x x n ====∑∑∑11,,1,2,,;1,2,,.lij ijk ij ij k x x x x i m j r l ⋅⋅⋅=====∑111,,1,2,,.r li ijk i i j k x x x x i m rl⋅⋅⋅⋅⋅⋅=====∑∑ 111,,1,2,,.mlj ijk j j i k x x x x j r ml⋅⋅⋅⋅⋅⋅=====∑∑双因素等重复试验的方差分析计算量较大.其基本原理也是将总的偏差平方和作如下分解:- 218 - 211122111122111()()()()()m r lt ijk i j k mrlmijk ij i i j k i rm rj ij i j j i j e A B A BS x x x x rl x x ml x x k x x x x S S S S ===⋅⋅⋅====⋅⋅⋅⋅⋅⋅⋅===⨯=-=-+-+-+--+=+++∑∑∑∑∑∑∑∑∑∑ (9.35)其中各偏差平方和的表达式如下:2111()m r le ijk ij i j k S x x ⋅====-∑∑∑21()mA i i S rl x x ⋅⋅==-∑21()rB j j S ml x x ⋅⋅==-∑211()m rA B ij i j i j S k x x x x ⨯⋅⋅⋅⋅⋅===--+∑∑e S 为误差平方和,反映了随机误差对试验指标的影响;A S 和B S 分别为因素A 和B 的偏差平方和,分别反映了因素A 和B 对试验结果的影响程度,A B S ⨯为A 与B 的交互作用A B ⨯的偏差平方和.当假设“H A :因素A 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]A A e S m F F m mr l S mr l -=---当假设“H B :因素B 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]B B e S r F F r mr l S mr l -=---当假设“H AB :交互因素AB 对试验结果无显著影响”成立时()/[(1)(1)]~(1)(1),(1)/[(1)]A B B e S m r F F m r mr l S mr l ⨯--=----检验过程可归纳在如表9.11所示的方差分析表中.立性和等方差性.从理论上讲对上述假定都要通过样本进行统计检验.有关独立性问题,通常是通过试验设计来解决.至于正态性和等方差性,可以根据第八章进行拟合优度检验和Bartlett 检验,还可以对原始数据进行适当的变换,使之满足正态性和等方差性.习 题 九1. 某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡.在每批灯泡中随机地其中(1,2,3,4)i t i =表示第i 批灯泡的寿命.试问(1) 四种灯丝生产的灯泡的使用寿命有无显著差异(0.05α=)? (2) 用S 法比较任意两批灯泡平均寿命之间的差异性(0.05α=).2. 设有三种型号的设备制造同一产品,对每种型号的设备各观测其5天的日产量,数x i 表示第i种型号的设备的日产量.问不同型号的设备生产能力之间是否其中(1,2,3)i有显著差异?3. 为了解3种不同饲料对猪生长影响的差异,用3个品种的猪进行全面搭配试验,3个月后测得9头猪的体重增加量(单位:kg)如下表:试分析饲料之间及猪的品种之间对猪的体重增加有无显著差异.4. 一种火箭使用了四种燃料、三种推进器作射程试验,对于燃料与推进器的每一种搭试检验燃料和推进器对火箭射程是否有显著影响,以及两个因素的交互作用对火箭射程是否有显著影响.- 220 -。

第九章 方差分析

第九章 方差分析

3。计算各部分变异的均方 在方差分析中 ,方差也称为均方,是各部分的离均差平 方和除以其相应的自由度,用MS表示。基 本公式为:MS=SS/ν。 4。计算统计量F值 F值是指两个均方之比。 一般是用较大的均方除以较小的均方。故 F值一般不会小于1。
5。确定P值,推断结论 根据分子ν1,分母 ν2,查F界值表(方差分析用),得到F 值的临界值(critical value),即:如 果F≥F界值,则P≤0.05,在α=0.05水准 上拒绝H0,接受H1。可以认为各样本所代表 的总体均数不全相等。如果想要了解哪两 个样本均数之间有差异,可以继续进行各 样本均数的两两比较。

结论:拒绝H0。四个行业的服务质量有显著差异
用Excel分析
选一批单元格输入原始数据; 选中数据区域,“工具”→“数据分析”;
1.输入数据表;选“工具”→“数据分析 ”→“……‖
1.输入数据表;选“工具”→“数据分 析”→“单因素方差分析”
―单因素方差分析”对话框中:输入区 域,行,输出区域
Ar
X r1 ... X rnr
列和Ti X ij
j 1
ni
T 1
T2
...
Tr
总和 Ti
i 1
r
列平均X i Ti ni
(水平组内平均值)
X1
X2
...
Xr
r
(总平均值)
1 r X ni X i n i 1
其中诸
ni 可以不一样, ni n
i 1
单因素方差分析表
3.处理
处理——指按单因素的各个“水平”条 件或多因素的各个“水平”的组合条件进行 的重复实验。 例如,要研究性别因素对智力发展的影 响,可以从同龄学生中各抽取男女学生50名 参加智力测验。性别因素所分成的两个水平 (男和女)即两种处理。

重复测量数据方差分析

重复测量数据方差分析

74.4
77.0
75.2 77.4
82.6
80.4
81.2 79.6
68.6
65.0
63.2 63.4
79.0
77.0
73.8 72.5
69.4
66.8
64.4 60.8
72.6
71.0
68.2 70.2
72.4
72.6
72.8 72.6
75.6
73.4
73.4 72.2
80.0
78.0
76.4 74.8
7.90
9.75 8.02
经检验处理组与对照组的差值 d 方差不齐(F S12 / S22 6.58 , P 0.01),不符合两均数比较 t 检验的前提条件。
设置对照旳前后测量设计
前后测量数据间存在明显差别时,并不能阐明这种差 别是由前后测量之间施加旳处理所产生,还是因为存 在于前后两次测量之间旳时间效应所致。
比较
表9-2 两种措施对乳酸饮料中脂肪含量旳测定成果(%)
编号
1 2 3 4 5 6 7 8 9 10
哥特里-罗紫法
0.840 0.591 0.674 0.632 0.687 0.978 0.750 0.730 1.200 0.870
脂肪酸水解法
0.580 0.509 0.500 0.316 0.337 0.517 0.454 0.512 0.997 0.506
受试 对象j
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
剂型 k
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
服药后测定时间i(周)

心理统计学课件第九章 方差分析

心理统计学课件第九章 方差分析

ij
Xj
X
2 k n j 1 i 1
Xt

2
SST SSW SSB
总平方和,表示实验中产生的总变异,即 把所有被试的数值作为一个整体考虑,是 用所有被试的因变量的值计算得到的 组间平方和,表示由于不同的实验处理而 造成的变异,可以用两个平均数之间的离 差表示。 组内平方和,表示有实验误差或个体差异 造成的变异。
n2Fra bibliotekX n
2

组内平方

SSW X 2
2 X
n

总平方和
SST X
2
X
n
2
6、列方差分析表
变异来源 平方和 自由度 方差 F 值 概率
组间变异
组内变异
SSB
SSw
dfB
dfw
MSB
MSw
F
MS B MSW
P
总变异
SST
dfT
SSB
2 X
第九章 方差分析
第一节 方差分析的基本原理及步骤 第二节 完全随机设计的方差分析
方差分析
方差分析又称为变异分析(analysis of variance,ANOVA),是由斯内德克 (George Waddel Snedecor)提出的一种 方法。 探讨一个因变量和一个或多个自变量之间 关系的一种检验方法。 主要功能:分析实验数据中不同来源的变 异对总变异的贡献大小,从而确定实验中 的自变量是否对因变量有重要影响。

第二节 完全随机设计的方差分析
各实验处理组样本容量相同 各实验处理组样本容量不同 利用样本统计量进行方差分析

一、各实验处理组样本容量相同
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011-2-7 16
表 9-1 高剂量组 (i=1) 5.6 9.5 6.0 8.7 9.2
Xij
三组患者 4 周后血糖的下降值(mmol / L) 低剂量组 (i=2) 对照组 (i=3) 2.0 5.6 7.0 7.9 4.3 6.4 7.0 5.4 3.1 12.4 0.9 7.0 3.9 1.6 6.4 3.0 3.9 2.2 1.1 2.7 7.8 6.9 1.5 9.4 3.8 7.5 8.4 12.2 6.0 合计
不全相等, 值将明显大于1 如果 µ1 , µ 2 ,L , µ k 不全相等,F 值将明显大于1。 界值( 用F界值(单侧界值)确定 值。 界值 单侧界值)确定P
2011-2-7 27
三、变异分解
C=
(∑X)2 N
完全随机设计资料的方差分析表
变异来源 总变异 自由度 N-1 k-1 SS MS F
α = 0.05
2011-2-7 29
2 . 计算检验统计量 :
可根据下表的公式和前面表9-1下半部分数据来计算 可根据下表的公式和前面表 下半部分数据来计算 也可用统计软件包如SAS或SPSS等进行计算,直接 或 等进行计算, 也可用统计软件包如 等进行计算 获得表9-4的方差分析表。 获得表 的方差分析表。 的方差分析表
v 间 = 3−1 组
M 组间 =176.7612/ 2 =88.3806 S
2011-2-7 21
3.组内变异:各组内各测量值Xij与其所 组内变异:
在组的均数的差值的平方和,反映随机误差 在组的均数的差值的平方和,反映随机误差 的影响. 的影响.
SS组内 = SSW = SSE = ∑∑ Xij − Xi )2 = ∑ ni −1 Si2 ( ( )
2011-2-7
返回
9
二、方差分析的几个名词和符号
什么是方差? 什么是方差? 方差 离均差 离均差平方和SS 离均差平方和 方差( 均方( ) 方差(σ2 S2 )均方(MS) 标准差: 标准差:S 自由度: 自由度: ν 关系: 关系: MS= SS/ ν
2011-2-7 10
各种符号的意义
Xij第i 个组的第 个观察值 个组的第j i=1,2,…k j=1,2,…ni ni第i 个处理组的例数 ∑ni=N Xi =第i组的均数 第 组的均数 X=总的均数 总的均数
2011-2-7
12
四、应用条件
1)各样本是相互独立的随机样本 )各样本是相互独立的随机样本 2)各样本来自正态总体 )各样本来自正态总体 3)各处理组总体方差相等,即方差齐 )各处理组总体方差相等,
2011-2-7
13
第二节
完全随机设计资料的 方差分析
2011-2-7 14
一、完全随机设计 completely random design
2011-2-7
32
注意: 注意:
方差分析的结果拒绝H 接受H 方差分析的结果拒绝 0,接受 1,不能 说明各组总体均数间两两都有差别。 说明各组总体均数间两两都有差别 。 如果 要分析哪些两组间有差别, 可进行多个均 要分析哪些两组间有差别 , 数间的多重比较(见本章第五节) 数间的多重比较(见本章第五节)。当k=2 时 , 完全随机设计方差分析与成组设计资 料的t 检验等价, 料的 检验等价,有 t = F 。
2011-2-7
11
三、方差分析的基本思想
根据变异的来源,将全部观察值总的离均差平 根据变异的来源,将全部观察值总的离均差平 方和及自由度分解为两个或多个部分 分解为两个或多个部分, 方和及自由度分解为两个或多个部分,除随机 误差外, 误差外,其余每个部分的变异可由某些特定因 素的作用加以解释。 素的作用加以解释。 通过比较不同来源变异的方差( 通过比较不同来源变异的方差(也叫均方 MS),借助 分布做出统计推断,从而判断某 ),借助 分布做出统计推断, ),借助F分布做出统计推断 因素对观察指标有无影响。 因素对观察指标有无影响。
∑X2 −C
组 间
∑ni (Xi − X)
i
2
SS组间
ν组间 ν组内
M 组间 S M 组内 S
组 内
N-k
SS总 −SS组间
SS组内
2011-2-7
28
四、分析步骤
1. 建立检验假设,确定检验水准 建立检验假设,确定检验水准:
H0:µ1 = µ 2 = µ 3 即3组总体均数相等 组总体均数相等 H1:3组总体均数不等或不全相等 组总体均数不等或不全相等
20 5.4300 2.3843
60(N) 6.859( X 18.4176(S²)
17
)
Si
总变异
组间
组内
二、列举存在的变异及意义
1、全部的 个实验数据之间大小不等, 、全部的60个实验数据之间大小不等 个实验数据之间大小不等, 存在变异(总变异)。 存在变异(总变异)。 2、各个组间存在变异:反映处理因素之 、各个组间存在变异: 间的作用,以及随机误差。 间的作用,以及随机误差。 3、各个组内个体间数据不同:反映了观 、各个组内个体间数据不同: 察值的随机误差。 察值的随机误差。 思考:各种变异的表示方法? 思考:各种变异的表示方法?
第九章 方差分析
analysis of variance, ANOVA
2011-2-7 1
方差分析由 R.A.Fisher(英)首创, 英 首创 首创, 又称F检验 又称 检验 缩写: 缩写:ANOVA
2011-2-7
2
讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 析因设计的方差分析 重复测量资料的方差分析 多个样本均数间的多重比较
2011-2-7
5
处理因素和 处理因素和水平
研究者对研究对象人为地施加某种干预措施, 研究者对研究对象人为地施加某种干预措施, 称为处理因素(factor)或实验因素; 或实验因素; 称为处理因素 或实验因素 处理因素所处的不同状态称为水平(level)。 。 处理因素所处的不同状态称为水平 处理因素的水平数≥2,即实验的组数。 处理因素的水平数 ,即实验的组数。
2011-2-7
31
3. 确定 值,作出推断结论: 确定P值 作出推断结论:
本例: 本例:ν1=3−1=2,ν2=60−3=57。因附表 中ν2无57, , 。因附表3中 , 故取最接近者ν 水准, 故取最接近者 2=60, 得P<0.01。按α=0.05水准,拒绝 。 水准 H0,接受 1,有统计学意义。 接受H 有统计学意义。 可以认为2型糖尿病患者经药物 新药和标准药物 可以认为 型糖尿病患者经药物(新药和标准药物 治 型糖尿病患者经药物 新药和标准药物)治 小时血糖的总体平均水平不全相同, 疗4周,其餐后 小时血糖的总体平均水平不全相同, 周 其餐后2小时血糖的总体平均水平不全相同 即三个总体均数中至少有两个不同。 即三个总体均数中至少有两个不同。
第一节
基本思想及应用条件
2011-2-7 4
一、为什么要学方差分析? 为什么要学方差分析?
概述:在进行科研时, 概述:在进行科研时,有时要按实验设计将 所研究的对象分为多个处理组施加不同的干 处理因素, 施加的干预称为处理因素 处理因素至 预,施加的干预称为处理因素,处理因素至 少有两个水平。 少有两个水平。
检验, 多次重复使用 t 检验,会使犯第一类 错误的概率增大。 错误的概率增大。下一页 脱离了原先的实验设计, 脱离了原先的实验设计,将多个样本 均数地同时比较转变为两个均数的多 次比较。 次比较。
2011-2-7 8
例如,有4个样本均数,两两组合数 4 检验做6次比较 次比较, 为 ( ) = 6 ,若用 t 检验做 次比较,且每次比 2 较的检验水准定为α=0.05, 则每次比较不犯 较的检验水准定为 , 次均不犯Ⅰ ) 次均不犯 Ⅰ类错误的概率为(1-0.05),6次均不犯Ⅰ 类错误的概率为( 类错误的概率为 (1-0.05)6,这时,总的检验 这时, 远比0.05大。因 水准变为 1-(1-0.05)6 = 0.26 ,远比 大 此 , 样本均数间的多重比较不能用两样本均 检验。 数比较的 t 检验。
映处理因素的作用和随机误差的影响
如果有 个总体均数有 如果有——k个总体均数有差别 个总体均数 如果无 个总体均数无 如果无——k个总体均数无差别 个总体均数
SS组间 = SSB = ∑ni (Xi − X)
i= 1
k
2
ν组间 = k −1
2011-2-7 20
SS组间 = 21(9.1952−6.8650)2 +19(5.8000−6.8650)2 +20(5.4300−6.850)2 =176.7612
i= j= 1 1 i k ni
v组内 = v2 = N −k
2011-2-7 22
SS组内 = (21−1 ×17.6305+(19−1 ×18.1867+(20−1 ×12.3843 ) ) ) = 909.8723
v组内 = v2 = 60−3
M =909.8723/57 =15.9627 S
2011-2-7 18
1.总变异 1.总变异: 所有测量值之间总的变异程度
SS总 = SST = ∑∑(Xij − X)
i= j = 1 1 k ni 2
ν总 = N −1
SS总=18.4176×(60-1)=1086.619
2.组间变异:各组均数与总均数的离均差平方和,反 组间变异:各组均数与总均数的离均差平方和,
16.3 11.8 14.6 4.9 8.1 3.8 6.1 13.2 16.5 9.2
-0.6 5.7 12.8 4.1 -1.8 -0.1 6.3 12.7 9.8 12.6
5.0 3.5 5.8 8.8 15.5 11.8
相关文档
最新文档