第六章方差分析

第六章方差分析
第六章方差分析

第六章方差分析

一、方差分析(Analysis of variance,ANOVA):

又叫变量分析,是英国著名统计学家R . A . Fisher于20世纪提出的。它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。方差分析的基本功能:对多组样本平均数差异的显著性进行检验

二、对多个处理进行平均数差异显著性检验时,采用t检验法的缺点:

(1)检验过程烦琐。

(2)无统一的试验误差,误差估计的精确性和检验的灵敏性低。

(3)推断的可靠性低,检验时犯α错误概率大。

三、试验指标(experimental index):

为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。

四、试验因素( experimental factor):

试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。

五、因素水平(level of factor):

试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。

六、试验处理(treatment):

事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。

七、试验单位( experimental unit ):

在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。

八、重复(repetition):

在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。

第一节方差分析的基本原理

方差:又叫均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得出一系列不同的观测值。

观测值不同的原因:处理效应(treatment effect):处理不同引起;试验误差:试验过程中偶然性因素的干扰和测量误差所致。

1.方差分析的基本思想

处理效应总变异试验误差

2.方差分析的目的

确定各种原因在总变异中所占的重要程度。

处理效应相差不大,说明试验处理对指标影响不大。

试验误差相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。

3.方差分析的用途

1. 用于多个样本平均数的比较

2. 分析多个因素间的交互作用

3. 回归方程的假设检验

4. 方差的同质性检验

(二)数学模型

假定有k组观测数据,每组有n个观测值,则共有nk个观测值

用线性模型(linear model)来描述每一观测值:

xij =μ + τi +εij (i=1,2,3…,k j=1,2,3…,n)

μ-总体平均数;τi -处理效应;εij -试验误差

xij -是在第 i 次处理下的第 j 次观测值

要求εij 是相互独立的,且服从标准正态分布 N(0,σ2 )

对于由样本估计的线性模型为:

xij =x + ti +eij

x -样本平均数;ti -样本处理效应;eij -试验误差

根据的τi不同假定,可将数学模型分为以下三种:固定模型;随机模型;混合模型

(一)固定模型(fixed model):指各个处理的效应值τi 是固定值,各个的平均效应τi =μi -μ是一个常量,且∑τi =0。就是说除去随机误差以后每个处理所产生的效应是固定的。

实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。

在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果

方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。(二)随机模型(random model):指各处理的效应值τi 不是固定的数值,而是由随机因素所引起的效应。这里τi 是一个随机变量,是从期望均值为 0,方差为σ 2 的标准正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。

在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果

方差分析所得到的结论,可以推广到这个因素的所有水平上

1.固定模型与随机模型的比较

1. 两者在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。其平方和与df 的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。

2. 模型分析的侧重点也不完全相同,方差期望值也不一样,固定模型主要侧重于效应值的估计和比较,而随机模型则侧重效应方差的估计和检验

3. 对于单因素方差分析来说,两者并无多大区别

(三)混合模型(mixed model):指多因素试验中既有固定因素又有随机因素时所用的模型. 在实际应用中,固定模型应用最多,随机模型和混合模型相对较少 (三)平方和与df 的分解

方差是离均差平方和除以自由度的商

方差分析的基本思想 引起观测值出现变异分解为处理效应的变异和试验误差的变异。 要把一个试验的总变异依据变异来源分为相应的变异,首先要将总平方和和总df 分解为各个变异来源的的相应部分。

平方和

处理间平均数的差异是由处理效应引起的:

处理内的变异是由随机误差引起:

)(--i x x 0)()(21=--∑

n i i x x x x

方差分析表 平方和

自由度 方差 处理间

处理内

总变异

1

)

(;)

(2

2

2

2

--=

-=

∑∑-

n x x s N

x μσ)(-

--x x i C

x

SS T -=

∑2

1

-=k df t )

1(-=n k df e 1

-=nk df T t t t df SS s =

2

e

e e d

f SS s =

2

nk

T

C 2

=

C

T n

SS i t -=

∑2

1t

T e SS SS SS -=

第二节 单因素方差分析90

在试验中所考虑的因素只有一个时,称为单因素实验。单因素方差分析是最简单的一种,它适用于只研究一个试验因素的资料,目的在于正确判断该试验因素各处理的相对效果(各水平的优劣).

(1)组内观测次数相等的方差分析

是指在k 组处理中,每一处理皆含有n 个观测值,其方差分析方法前面已做介绍,这里以方差分析表的形式给出有关计算公式: 变异来源 处理间

误差或处理内 总和

平方和 SS t SS e SS T

自由度 k-1 k(n-1) nk-1

均方 s t 2 s e 2

F

2

2e

t

s s F =

(2)组内观测次数不相等的方差分析 变异来源

处理间

误差或处理内 总和

平方和

C n T i

i

-∑

2

SS e SS T

自由度 k-1

∑n i -k ∑n i -1

均方 s t 2 s e 2

F

22

e

t s

s F =

在作多重比较时,首先应计算平均数的标准误。由于各组内观测次数不等,因此应需先算得各ni 的平均数n 0 : (各个处理的样本容量)

()()()

102

2--∑∑∑=k n n n i

i i n 检验)(或检验LSD 2)(LSR 0

2

2

21n s s n s s e

x x e

x =

=

-

第三节双因素方差分析

1、试验指标:衡量试验结果的标准

2、因素(factor):也叫因子,是指对试验指标有影响,在研究中加以(控制)考虑的试验

条件。

3、可控因子:在试验中可以人为地加以调控的因子浓度、温度等

4、非控因子:不能人为调控的因素(气象、环境等)

5、固定因素:指因素的水平是经过特意选择的

6、随机因素:指因素的水平是从该因素水平总体中随机抽出的样本

7、水平(level):每个因素的不同状态(从质或量方面分成不同的等级)

(因素是一个抽象的概念,水平则是一个较为具体的概念)

8、处理:指对试验对象施以不同的措施(对单因素试验而言,水平和处理是一致的,一个水平就是一个处理;对多因素试验而言,处理就是指水平与水平的组合)

9、固定效应(fixed effect):由固定因素所引起的效应。

10、随机效应(random effect):由随机因素引起的效应。

11、二因素方差分析:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。

12、固定模型:二因素都是固定因素

13、随机模型:二因素均为随机因素

14、混合模型:一个因素是固定因素,一个因素是随机因素

15、主效应(main effect):各试验因素的相对独立作用

16、互作(interaction):某一因素在另一因素的不同水平上所产生的效应不同。

17、因素间的交互作用显著与否关系到主效应的利用价值

如果交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的处理组合。

如果交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的直接表现选定。有时交互作用相当大,甚至可以忽略主效应。

二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。

(一)无重复观测值的二因素方差分析

依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定A

因素有a各水平,B因素有b个水平,每个处理组合只有一个观测值。

2

2

2

2

222

2

..2

.2

.2

.

2

.2

2

2

F 43)1)(1(1112)()()()()1(e

B

B e A A e

e e B B B A A

A e

B A T B

A

T j i ij e j j B i i A

ij T s s F s s F df SS s df SS s df SS

s b a df b df a df ab df SS SS

SS x x x x SS C

a

T x x a SS C

b

T x x b SS

C

x x x SS ab

T

C =

==

==--=-=-=-=--=+--=

-=-=-=

-=-=

-==

∑∑

∑∑∑∑

∑∑

值得计算)()各项的方差分别为(度

)与平方和相应的自由(平方和的分解

无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。

但是,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。

(二)具有重复观测值的二因素方差分析

具有重复观测值的二因素试验的典型设计是:假定A 因素有a 水平,B 因素有b 水平,则每一次重复都包括ab 次实验,设试验重复n 次,资料模式在p98

因试验共有n 次重复,试验的总次数为abn 次。方差分析步骤和前面介绍的相类似,唯一不同的是F 检验的方法。 154

2

22

22

22

2

2

2

22

2

2

2

2

22

2

2

2

2

2

22

..2

.2

2.

2

2

2

2

B A b a F 43)1()

1)(1(1

112)

()()

()

()

((1)e

AB AB e

B B AB

A A AB

B B AB

A A e

AB AB e

AB AB e

B B e

A A e

e

e

AB

AB AB B B B

A A A e AB

B A T AB

B A

T ij ijk e

B

A

ij

j i ij AB

j

j B

i i A

ijk T s s F s s F s s F c s s F s s F s s F s s F s s F s s F df SS

s df

SS s df

SS s df SS s n ab df b a df

b df a df abn df SS

SS

SS

SS x x SS

SS

SS

C n

T

x x x x n SS C

an

T

x x an

SS C

bn

T

x x bn

SS

C

x

x x SS abn

T

C =

==

=

=

=

=

=

=

=

=

=

=-=--=-=-=-=---=-=

---=

+--=-=

-=-=

-=-=

-==

∑∑∑

∑∑∑

∑∑

∑∑∑

∑∑∑;;随机)固定)混合模型((;;)随机模型(;;)固定模型(检验)()各项的方差分别为()自由度分解(平方和的分解:

第四节多因素方差分析(n )

实际工作中,往往需要考察三个或多个因素的效应。这相当于把二因素方差分析扩展到一般情况。如在一个试验中,A 因素有a 水平, B 因素有b 水平, C 因素有c 水平等,假设每一处理都有n 次重复,那么总观测次数为abcn 次。本节仅对三因素的情况进行分析。

实际分析时,可将三因素试验数据列成三个两向表(A 、B 因素组合,B 、C 因素组合,A 、C 因素组合),把三因素方差分析化为二因素方差分析。因此可以计算出SS A 、SS B 、SS C 、SS AB 、SS BC 、SS AC ,其中SS A 、SS B 、SS C 不需要重复计算。

)

1()1)(1)(1()1)(1()1)(1()1)(1(1

111222.2.2.

2

..2

.

.2

..

22

-=---=--=--=--=-=-=-=-=--

=-------=

---=---=

---=

-=-=-=

-=

=

∑∑∑∑∑∑∑∑∑∑∑∑∑

∑∑

∑∑∑∑n abc df c b a df c b df c a df b a df c df b df a df abcn df C

n

T SS SS SS SS

SS

SS SS SS

C n

T

SS

SS SS C an

T

SS SS SS

C bn

T

SS

SS SS C cn

T

SS C

abn T SS C

acn T SS C

bcn

T SS

C

x

SS abcn

T

C e ABC BC AC AB C B A T ijk

T

e BC

AC

AB

C B A

ijk

ABC

C

B jk

BC C

A

k

i AC

B A

ij AB

k

C j B i A

i

j

k l

ijkl

T

第五节方差分析缺失数据的估计(n )

第六节方差分析的基本假定和数据转换

方差分析的基本假定:正态性,可加性,方差同质性 正态性:试验误差应当是服从正态分布的独立的随机变量。因为方差分析只能估计随机误差,顺序排列或顺序取样资料不能作方差分析。应用方差分析的资料应服从正态分布,即每一观测值Xij 应围绕相应的平均数呈正态分布。非正态分布的资料进行适当数据转后,也能进行方差分析。

可加性:处理效应与误差效应应该是可加的,并服从方差分析的数学模型,即

xij =μ +αi +βj +εij

这样才能将试验的总变异分解为各种原因所引起的变异,以确定各变异在总变异中所占的比例,对试验结果作出客观评价。可加性是否显著有专门的统计方法。 方差同质性:所有试验的误差方差应具备同质性,也叫方差的齐性,即 σ12=σ22=…=σn 2

因为方差分析是将各个处理的试验误差合并以得到一个共同误差方差的,所以必须假定资料中这样一个共同方差存在。误差异质将使假设检验中某些处理效应得出不正确的结果。 方差的同质性检验前面已介绍过。如果发现有方差异质的现象,可将变异特别明显的数据剔除,当然剔除数据是应十分小心,以免失掉某些信息。或者将试验分成几个部分分析,使每部分具有同质的方差。

在生物学中,有时会遇到一些样本,其所来自的总体和方差分析的基本假定相抵触,这些数据在作方差分析之前必须经过适当处理及数据转换来更变测量标尺。

数据转换:样本的非正态性、不可加性和方差的异质性通常连带出现,主要的是考虑处理效应与误差效应的可加性,其次才考虑方差同质性。

数据转换常用的转化方法:平方根转换、对数转换、反正弦转化 平方根转换

有些生物学观测数据为泊松分布而非正态分布,比如一定面积上某种杂草株数或昆虫头数等,样本平均数与其方差有比例关系,采用平方根转换可获得同质的方差。一般将原观测值转化成x ,数据较小时采用1+x

对数转换

如果已知资料中的效应成比例而不是可加的,或者标准差(或极差)与平均数大体成比例时,可以使用对数变换。 反正弦转化

如果数据是比例或以百分率表示的,其分布趋向于二项分布,方差分析时应作反正弦转换,用下式把它们转化成一个相应的角度:P 1

sin

-=θ

方差分析的基本步骤:确定数学模型、平方和自由度分解、列方差分析表,进行F 检验、进行多重比较

第五章 统计学习题集 假设检验 第六章 方差分析

第五章 假设检验 第六章 方差分析 1、某厂生产一种产品,原月产量服从)14,75(N 。设备更新后,为了考察产量是否提高,抽查了6个月的产量,其平均产量为78。问在显著水平5%条件下,设备是否值得更新? 2、某工厂对所生产的产品进行质量检验,规定:次品率不得超过0.01,方可出厂。现从一批产品中随机抽查80件,发现次品2件。试问在0.05的显著水平下,这批产品是否可以出厂? 3、已知某种电子元件的使用寿命服从标准差为100小时的正态分布,要求平均寿命不得低于1000小时。现在从一批这种电子元件中随机抽取25件,测得平均寿命为950小时。试在0.02 的显著性水平下,检验这批元件是否合格. 4、在正常生产情况下,某厂生产的无缝钢管的内径服从均值为54mm 、 标准差为0.9mm 的正态分布。某日从当天生产的产品中随机抽取10根,测得内径分别为:53.8,54.0,55.1,54.2,52.1,54.2,55.0,55.8,55.4,55.5(单位:mm )。试检验该日产品生产是否正常(α=5%)。 5、某专家认为A 地男孩入学率明显高于女孩,小学男女学生比例至少是6:4。从A 地小学中随机抽取400个学生的调查结果是:男生258人,女生142人.问当α=5%时,调查结果是否支持该专家的观点? 6、某饮料厂生产一种新型饮料,其颜色有四种分别为:橘黃色、粉色、绿色、和无色透明。随机从5家商场收集了前一期其销售量,数据如下表: 数据计算结果如下: 组间平方和为76.8445,组内平方和为39.084。问饮料的颜色是否对产品的销售量产生显著的影响? {66.8)3,16(05.0=F ,24.3)16,3(05.0=F ,29.5)16,3(01.0=F ,69.26)3,16(01.0=F }

第六章--spss的方差分析

第六章spss的方差分析 1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示: 1)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。 2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。 原假设:这五种推销方式是否存在显著差异。 步骤:建立SPSS数据→分析→比较均值→单因素→因变量导入销售额→变量导入方式→选项→选择方差同质性检验、均值图→选择LSD方法检验→确定 表6-1 方差齐性检验 销售额 Levene 统计量df1 df2 显著性 2.048 4 30 .113 表6-2 分析:sig值为0.00<0.05,故拒绝原假设,认为这五种销售方式中存在显著差异。 (2)多重比较:

分析:有表6-3可以看出,多重比较中sig值均小于0,05,所以拒绝原假设,认为五种推销方法存在显著差异均值图也可以看出均值对比图的曲折比较大,进一步验证了结论。 2、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。 1)请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么? 2)请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。 3)如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者?1)图表中可以看出,在方差齐性检验中,sig值为0.001,小于0.05,故拒绝原假设,所以方差不齐。2)表中空缺补充: ANOVA 销售量 平方和df 均方 F 显著性 组间1104.128 4 276.032 11.403 .000 组内1524.990 6324.206 总数2629.118 67

统计学教案习题05方差分析

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设和F 值的意义。 (3) 方差分析的使用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOV A )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方和误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组 间 )表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间= 21 )(x x n k i i i -∑= ,组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ? ???-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。 (3)总变异:所有观察值之间的变异(不分组),这种变异叫做总变异(total variation)。其大小可用全体数据的方差表示, 也称总均方(MS 总 )。按方差的计算方法,MS 总= 总总ν/SS ,其中SS 总=211 )(∑∑==-k i n j ij i x x , k 为处理组数,i n 为第i 组例数,总ν=N -1为总的自由度, N 表示总例数。 (二)方差分析的使用条件 (1) 各样本是相互独立的随机样本,且来自正态分布总体。 (2) 各样本的总体方差相等,即方差齐性(homoscedasticity)。 (三)不同设计资料的方差分析 1.完全随机设计的单因素方差分析 (1)资料类型:完全随机设计(completely random design)是将受试对象完全随机地分配到各个处理组。设计因素

第六章方差分析

第六章方差分析 一、方差分析(Analysis of variance,ANOVA): 又叫变量分析,是英国著名统计学家R . A . Fisher于20世纪提出的。它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。方差分析的基本功能:对多组样本平均数差异的显著性进行检验 二、对多个处理进行平均数差异显著性检验时,采用t检验法的缺点: (1)检验过程烦琐。 (2)无统一的试验误差,误差估计的精确性和检验的灵敏性低。 (3)推断的可靠性低,检验时犯α错误概率大。 三、试验指标(experimental index): 为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。 四、试验因素( experimental factor): 试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。 五、因素水平(level of factor): 试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。 六、试验处理(treatment): 事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。 七、试验单位( experimental unit ): 在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。 八、重复(repetition): 在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。 第一节方差分析的基本原理 方差:又叫均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得出一系列不同的观测值。 观测值不同的原因:处理效应(treatment effect):处理不同引起;试验误差:试验过程中偶然性因素的干扰和测量误差所致。

第六章 方差分析

第六章方差分析 方差的计算公式 ()2 2 1 x X S n - = - ∑ 【离均差平方和:()2 x X - ∑;分母为自由度:n-1】 第一节方差分析的基本思想 用途:检验3组及以上总体均数是否相等。通过分析处理组均数之间的差别,推论它们所代表的k个总体均数间是否存在差别,或k个处理组间的差别是否具有统计学意义。 = 组间变异+ 组内变异 SS总 组内。 F= MS组间/ MS组内 如果:各样本均数来自同一总体(H0: ),即各组均数之间无差别。 则:组间变异与组内变异均只能反映随机误差,此时:F 值应接近1。 反之,若各样本均数不是来自同一总体,组间变异应较大,F 值将明显大于1,则不能认为组间的变异仅反映随机误差,也就是认为处理因素有作用。 F值要到多大才有统计学意义呢? 在各样本来自正态总体,各样本所来自的总体方差相等的假定之下,当H0成立时,检验统计量F 服从自由度ν组间=k-1,ν组内=N-k的F 分布,表示为:F ~ F (ν组间, ν组内) 可由F界值表查出在某一α水准下F分布的单尾界值F α。当F < F(ν组间, ν组内), P> α。 方差分析的基本思想 1·根据资料的设计类型,将全部观察值总的离均差平方和及自由度分解为两个或多个部分, 2·除随机误差(如SS组内)外,其余每个部分的变异(如SS组间)可由某个因素的作用(或某几个因素的交互作用,如A因素×B因素)加以解释。 3·通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。方差分析对数据的基本假设(方差分析的应用条件) 1·任何两个观察值之间均不相关 2·每一水平下的观察值均来自正态总体 3·各总体方差相等,即方差齐性(homogeneity of variance) 第二节完全随机设计资料的单因素方差分析 1·在实验研究中,将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效应。 如将30名乙型脑炎患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗(药物这个研究因素分为3个水平),观察治疗后的退热时间。 2·在观察研究中,按某个因素的不同水平分组,比较该因素的效应。 如比较糖尿病患者,IGT异常和正常人的载脂蛋白有无差别(人群这个研究因素分为3个水平)。 一、完全随机设计 如何分组:可以利用随机数字表(医学统计中的研究设计介绍) 二、变异分解: 例:某社区随机抽取了30名糖尿病患者(11例),IGT异常(9例)和正常人(10例)进行载脂蛋白(mg/dL)测定,问三种人的载脂蛋白有无差别? 1.完全随机设计方差分析中变异的分解 总变异= 组间变异+ 组内变异 2. 分析计算步骤建立检验假设和确定检验水准

相关文档
最新文档