第六讲方差分析

第六讲方差分析
第六讲方差分析

第五章 方差分析

第一节 概述

前面介绍了两样本均数比较的t 检验,但在实际研究中经常需要多组均数的比较。如:例5.1 患有某种肿瘤的大白鼠接受不同实验处理后(对照未服药;服抗癌A 药;服抗癌B 药;服抗癌C 药),2周后体内存活的肿瘤细胞数如表5.1所示,比较不同实验处理后的平均存活肿瘤细胞数是否有差异。

表5.1 不同实验处理后存活肿瘤细胞数(有丝分裂细胞/10个高倍镜视野) 对照 服抗癌A 药

服抗癌B 药

服抗癌C 药

合计

48 45 23 5 50 51 20 6 46 47 22 0 52 48 19 2 48 47 21 2

50 4 N

5 6 5 6 22 x

48.80 48.00 21.00 3.17 33.45 s

2.28

2.19

1.58

2.23

20.14

本例中共有4种实验处理,在实验设计中称为一个因素中的4个水平:第一个水平为对照处理;第二个水平为服用A 药处理;第三个水平为服用B 药处理;第四个水平为服用C 药处理。根据本例的研究问题,相应的假设检验为

H 0:μ1=μ2=μ3=μ4 vs H 1:μ1,μ2,μ3,μ4不全相同 ● 不能用t 检验进行两两比较,第一类错误会增大。

由于本例共有4组的均数需要比较。如果用t 检验进行两两比较,共要进行2

46C =次

t 检验。如果每次t 检验犯第一类错误的概率为0.05,则不犯第一类错误的概率为0.95,

6次都不犯第一类错误的概率为60.950.7351=,因此在6次t 检验中至少有一次犯第一类错误的概率为610.950.26490.05-=>>。由此可见用t 检验进行多组均数的比较会增大犯第一类错误的概率。

● 要用方差分析或多组的秩和检验(Kruskal Wallis test)的方法进行多组比较:

方差分析的英文全称为Analysis of Variance ,缩写简称为ANOVA 。 ● 统计分析策略

? 如果每一组资料服从正态分布(或大样本),并且方差齐性,则可以用方差分析的方

法进行比较。

? 如果方差不齐或小样本而非正态分布,则用Kruskal Wallis 进行检验。

第二节 完全随机设计资料的方差分析

一、完全随机设计

表5.1 不同实验处理后存活肿瘤细胞数(有丝分裂细胞/10个高倍镜视野) 对照(i=1) 服抗癌A 药(I=2) 服抗癌B 药(I=3) 服抗癌C 药(I=4) 合计

48 45 23 5

50 51 20 6 46 47 22 0 52 48 19 2 48 47 21 2 50 4 n 5 6 5 6 22

x 48.80

48.00 21.00 3.17 33.45 s 2.28 2.19 1.58 2.23 20.14

例5.1就是完全随机设计的资料。该例中的处理因素是不同的实验处理(即服用不同药物情况),共有4个水平,对照未服药、服抗癌A 药、服抗癌B 药和服抗癌C 药,观察指标是大白鼠体内存活肿瘤细胞数,观察结果及部分描述统计量见表5.1。

二、变异的分解(以本例为例)

组间变异11223344()()()()SS n X X n X X n X X n X X =-+-+-+-组间

其中1234,,,X X X X 为第1组,第2组,第3组和第4组的样本均数,X 为所有数据的平均数。 自由度v=4-1=3

组内变异2

2

2

2

11223344(1)(1)(1)(1)SS n S n S n S n S =-+-+-+-组内

1234,,,S S S S 为各组的样本标准差。

自由度v=22-4=18 可以证明:

? H 0:μ1=μ2=μ3=μ4成立时,SS 组间较小 ? H 0:μ1=μ2=μ3=μ4不成立时,SS 组间较大

? H 0:μ1=μ2=μ3=μ4是否成立与组内变异SS 组内无关。 ? SS 总=SS 组间+SS 组内,其中

()()()()()()

ij j i SS x X x X x X x X x X x X ==-+-+

+-+-++-=-∑∑22222

11215112644

2

1

其中X 表示所有资料的平均数,用N 表示总样本量(本例N=5+6+5+6=22)。 资料X i j 越离散,SS 越大,反之亦然。

SS 还与样本的自由度(degree of freedom )=N -1有关(N 为总样本量),自由度增大,SS 增大。

组内变异自由度为k N -=组内ν

由于组间变异和组内变异与自由度有关,所以不能直接比较离均差平方和。将各部分的离均差平方和除以各自的自由度,得到相应的平均变异指标:均方(mean square ,记为MS )。组间变异和组内变异的均方可通过公式5.7和公式5.8计算得到。

组间

组间

组间νSS MS =

(5.7)

组内

组内

组内νSS MS =

(5.8)

均方消除了自由度的影响,因而可以进行比较。将组间均方除以组内均方,就得到方差分析的检验统计量F 。

组内

组间MS MS F =

(5.9)

可以证明,当H 0成立时,则 F 服从自由度为k -1和N -k 的F 分布;若H 0不成立,则F 不服从F 分布,且大多数情况下,F 远大于1。因此,可通过F 的大小判断H 0的成立与否。

三、方差分析的步骤

1.建立假设并确定检验水准 根据例5.1的题意,可作如下假设:

H 0:不同实验组大白鼠体内存活的肿瘤细胞数的总体均数相同,即4321μμμμ===; H 1:不同实验组大白鼠体内存活的肿瘤细胞数的总体均数不全相同。

检验水准:05.0=α

2、计算检验统计量 根据表5.3的计算公式,可计算各变异部分的离均差平方和、自由度、均方和检验统计量F 值。

表5.3 完全随机设计资料方差分析的计算公式(k 个样本)

变异来源 离均差平方和(SS ) 自由度(υ) 均方(MS ) F 值

组间变异 .()j j

j n x

X -∑2 1-k

组间

组间

νSS 组内

组间MS MS

组内变异 .()ij

j j

i

x

x -∑∑2

k N - 组内

组内

νSS

总变异

()ij i

j

x X -∑∑2

1-N

本例计算为用Stata 软件计算如下

由于本例样本量较少,正态性检验有些困难。可以采用各组资料减去相应的样本均数,然后再检验。

因此先计算各组的样本均数,Stata 命令 tab group,su(x)

gen d=0

replace d=x-48.8 if group==1

replace d=x-48 if group==2

replace d=x-21 if group==3

replace d=x-3.166667 if group==4

d称为残差。

进行正态性检验

sktest d

Skewness/Kurtosis tests for Normality

------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- d | 0.853 0.181 2.03 0.3633 没有证据认为资料偏态分布。

Stata命令:oneway 观察变量分组变量,t

本例命令: oneway x group,t

蓝色处为方差齐性检验。P =0.898>0.1,所以不能认为方差不齐。

均数的比较的P 值<0.0001,因此拒绝H 0:4321μμμμ===,并可以认为各组均数不全相等。

因此需用进一步组间两两比较,以确定那些组之间确有差异。

两两比较有许多方法,此处近介绍两种方法:lsd 方法和Bonferroni 方法 lsd 称为最小差异检验,适用于探索性研究。命令如下:

. lsd x group

LSD 方法进行 两两均数比较

输入效应变量分组变量

mean1-mean2= 0.800000 P-value=0.537814

mean1-mean3= 27.800000 P-value=0.000000

mean1-mean4= 45.633333 P-value=0.000000

mean2-mean3= 27.000000 P-value=0.000000

mean2-mean4= 44.833333 P-value=0.000000

mean3-mean4= 17.833333 P-value=0.000000

因此第1组和第2组之间的差异没有统计学意义(no significant),第1组和第2组的平均存活肿瘤细胞数分别高于第3组和第4组,第3组的平均存活肿瘤细胞数也高于第4组,差别有统计学意义。(the differences are statistically significant)。

Bonferroni 是一种比较保守的两两比较方法,通常用于比较慎重的研究结果。

命令如下:

红色处为P值。本例结果与LSD相同。

Bonferroni方法计算的P值=min(LSD的P值×比较次数,1)

本例的比较次数为3,所以Bonferroni方法计算的P值=LSD的P值×3

但是,第一组与第二组比较的LSD的P值×3>1,所以Bonferroni方法计算的P值=1。

单因素多组资料的秩和检验

成组设计多组计量资料的处理效应的比较,如果资料不满足完全随机设计的方差分析的应用条件,可用Kruskal-Wallis H检验(Kruskal-Wallis H test)。Kruskal-Wallis H检验用于推断计量资料或等级资料的多个独立样本所来自的多个总体的分布是否相同。统计检验方法、步骤和基本思想见例8.4。

(一)计量资料的多个样本比较

例8.4 研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机分为4组,每组10只,雌雄各半,用药15天后,测定E-玫瑰结形成率(X:%),结果见表8.4第(1)、(3)、(5)、(7)栏。问:单味中药对E-玫瑰结形成率有无影响?

表8.4 四组E-玫瑰结形成率(X:%)比较

对照组党参组黄芪组淫羊霍组

X X X X

(1) (2) (3) (4)

14 21 24 35

10 24 20 27

12 18 22 33

16 17 18 29

13 22 17 31

14 19 21 40 12 18 18 35 10 23 22 30 13 20 19 28 i

本例为百分率资料,不符合正态分布,现用Kruskal-Wallis H 检验。统计分析步骤如

下:

(1)检验假设:

0H :四组E-玫瑰结形成率的总体分布相同

1H :四组E-玫瑰结形成率的总体分布不全相同

0.05α=

(2)编秩:

把四个样本数据混合从小到大编秩次, (3)求秩和并确定检验统计量:

分组求秩和,按下式求检验统计量H 值。

2

2

12

12()()3(1)(1)

(1)

i

i

i

i

R H n R R N N N N N n =

-=

-+++∑∑

(8.5)

如果0H 成立,各个总体相同,各组的平均秩i R 应该非常接近总的平均秩R ,即:在通常情况下,统计量H 应该比较小,在样本量比较大时,近似服从χ2分布(Chi -Square )。反之,

0H 不成立时,各个总体不相同,各组的平均秩i R 应远离总的平均秩R ,统计量H 值会增大。

用Stata 软件进行检验如下:

Stata 格式如下:

Stata 命令

kwallis 观察变量 ,by(分组变量) 本例: kwallis x,by(g)

Kruskal-Wallis检验的P值=0.0001< ,所以可以认为四组样本所在总体不全相同。

进一步检验可以用两组比较的Wilcoxon秩和检验,结合Bonferroni校正P值的方法进行检验,但要根据研究问题,有选择地进行比较,仅可能地减少比较的次数。

第二节随机区组设计资料的方差分析

随机区组设计的优点是每个区组内的k个受试对象有较好的同质性,组间均衡性较好,与完全随机设计相比,可以较好地减少非研究因素对观察结果的影响(称为偏倚,Bias);缺点是要求区组内受试对象数与处理数相等,实验结果中若有数据缺失,统计分析较麻烦。

在医学科学研究中的随机区组设计主要有以下几种情况:1. 配对或配伍的k(k≥2)个受试对象分别接受 k种处理(即一个处理因素的k个水平)之后的数据;2. 同一样品用k 种方法(或仪器等)检验的结果;3. 同一受试对象k个部位的数据。

对于随机区组设计资料的统计分析,根据资料性质(定量或分类资料)、处理组数以及符合的统计分析条件,可选用配对t检验,配对秩和检验,配对卡方检验,随机区组的方差分析,随机区组的秩和检验等。

例1:某研究者将24名贫血患儿按年龄及贫血程度分成8个区组(b=8),每个区组的3个对象的年龄非常接近并且贫血程度也非常接近,每区组中三名儿童用随机的方式分配给A、B和C三种不同的治疗方法(处理组,k=3)。治疗后血红蛋白含量的增加量(g/L)列表如下(倪宗瓒,《医学统计学》第二版P84)

表1贫血患儿不同疗法治疗后血红蛋白含量的增加量(g/L)

区组A疗法B疗法C疗法

1 16 18 18

2 15 16 20

3 19 27 35

4 13 13 23

5 11 14 17

6 10 8 12

7 5 3 8

8 -2 -2 3

随机区组设计要求每个处理组内的研究对象个数必须是相同的,并且每个区组的观察例数也是相同的。随机区组设计的观察资料一般形式如表5.6所示的

二、变异分解

根据随机区组设计的性质,在例5.2中,血红蛋白含量增加量的变异除了总变异、处理组间变异(不同治疗方案之间)和个体变异外,还有区组间变异(不同组年龄和贫血程度之间)。各种变异之间的关系可用公式5.10表示:

SS总=SS处理组间+ SS区组间+SS误差(5.10)

1、处理组间变异 描述了不同治疗方案对应的血红蛋白含量增加量的样本均数之间的差异 ∑-j

j X x SS 2.)(n =处理 (5-11)

其中j x .为第j 个处理组的样本均数,自由度为1k -=处理v 。

如果3种治疗效果相同,则对应的总体均数应该相同,各个样本均数之间的差异一般会很小,所以SS 处理较小;如果3种治疗效果不同,对应的总体均数不同,各个样本均数之间的差异会较大,相应的SS 处理较大。

3、区组间变异 是指不同区组的血红蛋白含量增加量样本均数之间差异

∑-i

i X x k SS 2.)(=区组 (5.12)

由于同一区组的年龄和贫血程度非常接近,而不同年龄和贫血程度不同,它反映了不同年龄和贫血程度对血红蛋白含量增加量样本均数的影响。

4、误差 是指总变异中排除了处理变异和区组变异外,仅仅由随机误差引起的变异。其SS 误差的计算公式可以根据公式(5.13)来获得:

SS 误差=SS 总-SS 处理-SS 区组 (5.13)

其自由度为 (1)()k ν=-误差n-1

根据计算所得的SS 和自由度,可计算变异来源各部分的均方:

SS MS ν=

处理

处理处理

(5.14)

SS MS ν=

区组

区组区组

(5.15)

SS MS ν=

误差

误差误差

(5.16)

然后可以得到两个F 值:

MS F MS =

处理

处理

误差 (5.17)

MS F MS =

区组

区组误差

(5.18)

然后用F 分布进行检验。

即:比完全随机分组的方差分析多分离一个区组变异

用Stata软件进行统计分析如下

数据格式

Stata命令:

anova 观察变量处理变量区组变量本例命令

anova x g block

这里有3个P值,

Model的P值,对应的无效假设H0是处理效应和区组相应均对观察因素无作用

变量g对应的P值,对应的无效假设H0是处理效应对观察因素无作用。

区组变量Block对应的P值,对应的无效假设H0是区组效应对观察因素无作用。

本例的处理效应说明3种不同的治疗方案的疗效不全相同。

应用方差分析的注意事项

一、方差分析的应用条件

并非所有的数据都能作方差分析,进行多个样本均数比较方差分析的资料应该满足以下条件:

1. 完全随机设计资料的多个样本必须是相互独立的随机样本;

2. 样本均来自正态分布的总体;

3. 样本来自的总体方差相等,即方差齐性(homogeneity of variance)。

方差分析的用途非常广泛,不仅可以进行单个处理因素下多个样本均数的比较,还可以分析多个处理因素之间是否存在交互作用。本章仅仅介绍完全随机设计资料和随机区组设计资料的方差分析。

三、方差分析与t检验的关系

对于成组设计的两组均数比较,可以用成组t检验,也可以用完全随机设计的方差分析,可以证明t2=F,t的自由度正好为方差分析中的组内自由度,结果和结论完全是一致的,但是t检验可以做单侧假设检验,也可以做双侧假设检验;而方差分析只能做双侧假设检验。

对于1:1配对设计的均数比较问题,可以用配对t检验,也可以用随机区组设计的方差分析,同样可以证明t2=F,t的自由度正好为方差分析中的组内自由度,结果和结论完全是一致的,同理配对t检验可以做单侧假设检验,也可以做双侧假设检验;但方差分析只能做双侧假设检验。

第二章 常用统计技术(1)方差分析

第二章常用统计技术 第二章常用统计技术 【考试趋势】 单选4-5题,多选6-8题,综合分析7-8题。总分值30-40分。总分170分。占比20%左右。 【大纲考点】 一、方差分析 (一)方差分析基本概念 1.掌握因子、水平和方差分析的三项基本假定 2.熟悉方差分析是在同方差假定下检验多个正态均值是否相等的统计方法(难点) (二)方差分析方法 1.掌握单因子的方差分析方法(平方和分解、总平方和、因子平方和、误差平方和,自由由度、f比、显著性) (重点) 2.了解重复数不等情况下的方差分析方法。(难点) 二、回归分析 主要研究定量因子,也就是变量分析 (一)散布图与相关系数 1.掌握散布图的作用与做法 2.掌握样本相关系数的定义、计算及其检验方法(重点,难点) (二)一元线性回归 1.掌握用最小二乘估计建立一元线性回归方程的方法(重点,难点) 2.掌握一元线性回归方程的检验方法(重点,难点) 3.熟悉一元线性回归方法在预测中的应用 (三)了解可化为一元线性回归的曲线回归问题 三、试验设计 三、试验设计

(一)基本概念与正交表 1.了解试验设计的必要性 2.熟悉常用正交表及正交表的特点 (二)正交试验设计与分析 1.熟悉使用正交表进行试验设计的步骤 2.掌握无交互作用的正交试验设计的直观分析法与方差分析法 3.熟悉贡献率的分析方法 4.了解有交互作用的正交试验设计的方差分析法 5.熟悉最佳水平组合的选取 【考点解读】 三种统计技术的特点:新版教材第74页。 第一节方差分析 第一节方差分析 一、方差分析 1、三项基本假定-(掌握p75) 为什么要方差分析?目的和用途。方差分析不是简单分析方差,通过方差分析因子的显著与否。方差只是手段。对结果的影响是否显著。要用到假设检验。零假设,备择假设。 但是假设检验的前提条件是:正态分布,等方差,观测相互独立。也就是大纲里讲的三项基本假定。 2、方差分析的统计检验-(掌握p76) 那么如何在同方差假定下检验多个正态均值是否相等呢?其实统计检验的 问题。大家想一下,零假设,备择假设是什么? 同一个因子,有不同水平,每个水平重复多次试验就得到一个分布。有几个水平就有几个分布,方差分析是看分布的均值是否相等。相等,说明因子变动对结果没影响,相差越大就越显著! 3、单因子的方差分析-(掌握p76-79)

第六讲方差分析

第五章 方差分析 第一节 概述 前面介绍了两样本均数比较的t 检验,但在实际研究中经常需要多组均数的比较。如:例5.1 患有某种肿瘤的大白鼠接受不同实验处理后(对照未服药;服抗癌A 药;服抗癌B 药;服抗癌C 药),2周后体内存活的肿瘤细胞数如表5.1所示,比较不同实验处理后的平均存活肿瘤细胞数是否有差异。 表5.1 不同实验处理后存活肿瘤细胞数(有丝分裂细胞/10个高倍镜视野) 对照 服抗癌A 药 服抗癌B 药 服抗癌C 药 合计 48 45 23 5 50 51 20 6 46 47 22 0 52 48 19 2 48 47 21 2 50 4 N 5 6 5 6 22 x 48.80 48.00 21.00 3.17 33.45 s 2.28 2.19 1.58 2.23 20.14 本例中共有4种实验处理,在实验设计中称为一个因素中的4个水平:第一个水平为对照处理;第二个水平为服用A 药处理;第三个水平为服用B 药处理;第四个水平为服用C 药处理。根据本例的研究问题,相应的假设检验为 H 0:μ1=μ2=μ3=μ4 vs H 1:μ1,μ2,μ3,μ4不全相同 ● 不能用t 检验进行两两比较,第一类错误会增大。 由于本例共有4组的均数需要比较。如果用t 检验进行两两比较,共要进行2 46C =次 t 检验。如果每次t 检验犯第一类错误的概率为0.05,则不犯第一类错误的概率为0.95, 6次都不犯第一类错误的概率为60.950.7351=,因此在6次t 检验中至少有一次犯第一类错误的概率为610.950.26490.05-=>>。由此可见用t 检验进行多组均数的比较会增大犯第一类错误的概率。 ● 要用方差分析或多组的秩和检验(Kruskal Wallis test)的方法进行多组比较: 方差分析的英文全称为Analysis of Variance ,缩写简称为ANOVA 。 ● 统计分析策略 ? 如果每一组资料服从正态分布(或大样本),并且方差齐性,则可以用方差分析的方 法进行比较。

第10章单因素方差分析

第10章 单因素方差分析 单因素方差分析(0ne-Way ANOV A),又称一维方差分析,它能够对单因素多个独立样本 的均数进行比较,可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表,还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options) 10.1 单因素方差分析的计量资料 [例10—1] 某社区随机抽取了30名糖尿病患者、IGT 异常人和正常人进行载脂蛋白 (mg /dL)测定,结果示于表10—1。试问3组人群的载脂蛋白测定结果含量是否相同?(倪宗瓒.卫生统计学.第4版,北京:人民卫生出版社,2001.50) 组别(B ) 载脂蛋白测定 糖尿病(1) 85.7 105.2 109.5 96.0 115.2 95.3 110.0 100.0 125.6 111.0 106.5 96.0 124.5 105.1 76.4 95.3 110.0 95.2 99.0 120.0 144.0 117.0 110.0 109.0 103.0 123.0 127.0 121.0 159.0 115.0 IGT 异常(2) 正常人(3) 本例是一个完全随机设计的单因素方差分析。已建立SAS 数据集文件并保存Sasuser.onewav4。 (1)进入SAS /Win(v8)系统,单击Solutions -Analysis -Analyst ,得到分析家窗口。 (2)单击File-open By SAS Name —Sasuser-0neway4—0K ,调入数据文件。 (3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A ,得到图10—1所示对话框。本例因变量(Dependent)为A(载脂蛋白),单击A —Dependent 。自变量(1ndependent): B(3种人的组别),单击B —Independent 。 图10.1 0ne —way ANOV A :0neway4(单因素方差分析)对话框 (4)单击Tests 按钮,得到图10—2所示对话框。在此对话框的ANOV A(F —检验)选项 中可进行如下设置。 Analysis of variance ,方差分析。 Welch ’s variance-weighted ANOV A ,威尔奇方差—权重方差分析。 Tests for equal variance ,相等方差检验,即方差齐性检验。 Barlett ’s test ,巴特尼特检验。 Brown-Forsythe test ,布朗—福塞斯检验。 Levene ’s test ,列文检验。本例以上都选。

spss 多因素方差分析例子

作业8:多因素方差分析 1,data0806-height是从三个样方中测量的八种草的高度,问高度在三个取样地点,以及八种草之间有无差异?具体怎么差异的? 打开spss软件,打开data0806-height数据,点击Analyze->General Linear Model->Univariate 打开: 把plot和species送入Fixed Factor(s),把height送入Dependent Variable,点击Model 打开:

选择Full factorial,Type III Sum of squares,Include intercept in model(即全部默认选项),点击Continue回到Univariate主对话框,对其他选项卡不做任何选择, 结果输出:

因无法计算MM e rror,即无法分开MM intercept和MM error,无法检测interaction的影响,无法进行方差分析, 重新Analyze->General Linear Model->Univariate打开: 选择好Dependent Variable和Fixed Factor(s),点击Model打开: 点击Custom,把主效应变量species和plot送入Model框,点击Continue回到Univariate主对话框,点击Plots:

Univariate对话框,点击Options:

把OVERALL,species, plot送入Display Means for框,选择Compare main effects,Bonferroni,点击Continue回到Univariate对话框, 输出结果: 可以看到:SS species=33.165,df species=7,MS species=4.738;SS plot=33.165,df plot=7,MS plot=4.738;SS error=21.472,df error=14,MS error=1.534; Fspecies=3.089,p=0.034<0.05;Fplot=12.130,p=0.005<0.01; 所以故认为在5%的置信水平上,不同样地,不同物种之间的草高度是存在差异的。

第10章 方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

多因素方差分析

多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著 表5-7 不同温度与不同湿度粘虫发育历期表 数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口 3)设置分析变量 设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。 设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型 在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。 图5-8 “Univariate Model” 定义分析模型对话框

spss教程第二章均值比较检验与方差分析要点

第二章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。 ◆本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test); 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test); 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test); 4、单因素方差分析(One-Way ANOVA); 5、双因素方差分析(General Linear Model Univariate)。 ◆假设条件:研究的数据服从正态分布或近似地服从正态分布。 在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图2.1所示。 图2.1 均值的比较菜单选择项 §2.1 单个总体的t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。

例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在Test Value框中键入原假设的均值数10000。 4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。选择后默认值后返回主对话框。 图2.3 一个样本t检验的Options对话框 5、单击OK,得输出结果。如表2.1所示。 表2.1(a).数据的基本统计描述 One-Sample Statistics

双因素试验的方差分析(精)

实验三 双因素试验的方差分析 实验目的:1掌握单因素实验方差分析的方法与步骤; 2正确分析输出结果中的各参数,并得出正确结论。 试验内容: 某种火箭使用4种燃料,3种推进器进行射程试验。在每种燃料与每种推进器的组合下火箭各发射两次,射程数据见表3.1。 表3.1 火箭的射程数据 试在水平05.0=α下,检验不同燃料(因素)A 、不同推进器(因素)B 下射程是否有显著差异?交互作用是否显著? 操作步骤: 1.在excel 的工作表中输入如表3.1所示的的样本数据。 2.点击“工具—数据分析—方差分析:可重复双因素方差分析”,在弹出对话框的输入区域,拖动鼠标选择样本值A1:D9;每一样本的行数,输入2;显著性水平α设置为0.05,如图 3.1所示。

3.点击确定,输出参数的窗口如图3.2所示。 图3.2 应用excel“数据分析”功能求双因素等重复方差分析的有关参数结果分析: 图3.2 中仅列示了输出结果中的方差分析表。“样本”即燃料因子,“列”即推进器因子,“交互”为燃料和推进器因子的交互作用,SS 为平方和;df 是自由度;P-value 为P 值,即所达到的临界显著水平;F crit 是Fα(t-1,N-t)的值。 由方差分析表可知,因子A (燃料)的作用是一般显著的(P-value的值为0.025969<0.05);因子B(推进器)的作用是高度显著的(P-value的值为0.003506<0.01);而交互作用是极其显著的(P-value的值为6.15E-05<<0.01),这说明燃料的作用于与推进器之间有着密切的关 系,也即每种推进器都有各自最合自得最佳燃料。

第七章 方差分析.

第七章方差分析 方差分析(analysis of variance)是检验多个总体均值是否相等的统计方法。目的:通过检验多个总体的均值是否相等来判断定类变量对定距变量是否有显著影响。 第一节方差分析引述 一、方差分析的基本思想和原理 例1:想了解四个行业的服务质量如何,得到以下数据: 消费者对四个行业的投诉次数 自变量行业是分类变量,因变量被投诉次数是定距变量。 想知道行业对被投诉次数的影响,就要分析不同行业的被投诉次数之间是否有显著差异,即检验四个行业被投诉次数的总体均值是否相等(注意不是样本均值)。如果相等,行业对投诉次数无影响;如果均值不全相等,有影响。 为什么不用均值检验的方法? 均值检验一次只研究两个样本,要检验4个总体均值是否相等,需要6次检验(1-2,1-3,1-4,2-3,2-4,3-4)。每次检验犯第一类错误的概率是α,作多次检验会增加犯错概率和降低置信水平。而方差分析同时将所有样本信息结合在一起,增加了分析的可靠性,降低了犯错的概率,避免拒绝真实的原假设。如何用样本均值检验总体均值即判断行业对投诉次数是否有影响? 各行业被投诉次数的样本均值不相等,是否可说明不同行业被投诉次数有明显差异?不一定,也许各行业总体均值无差异,仅仅因为抽样的随机性造成了彼此之间的差异/随机误差。(来自同一个总体的各个样本之间因为随机性而造成的均值差异和来自不同总体的样本之间的均值差异在散点图上是有差异的。)所以,方差分析就是对于差异来源进行分析(来源于随机误差还是不同总体间的真实差异),从而判断不同总体均值是否相等。 在例1中,在同一行业(同一总体)下,样本的各观测值不同,其差异可看作抽样的随机性造成的,称之为随机误差。在不同行业(不同总体)下,各观测

第2章单因素方差分析

第12章方差分析(Analysis of V ariance) 方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。 在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能影响产品产量和质量特征。有的影响大些,有的影响小些。为了使生产过程稳定,保证优质高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。方差分析就是处理这类问题,从中找出最佳方案。 方差分析开始于本世纪20年代。1923年英国统计学家R.A. Fisher 首先提出这个概念,(ANOV A)。因当时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实验上,通过分析提高农作物产量的主要因素。Fisher1926年在澳大利亚去世。现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。 在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水平”或“处理”(treatment)。 若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是多因素试验。下面分别介绍单因素和双因素试验结果的方差分析。 1.1 单因素方差分析(One Way Analysis of Variance) 1.一般表达形式 2.方差分析的假定前提 3.数学模形 4.统计假设 5.方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验 6.举例 7.多重比较 1.1.1 一般表达形式 首先通过一个例子引出单因素方差分析方法。某农业科研所新培养了四种水稻品种,分别用A1,A2,A3,A4表示。每个品种随机选种在四块试验田中,共16块试验田。除水稻品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田中产量如下表: 通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。类似的例子很多,如劳动生产率差异,汽车燃油消耗,金属材料淬火温度等问题。上述问题可控实验条件是“种子”。所以种子是因素。把不同的品种A1,A2,A3,A4称为“水平”。1,2,3,4表示试验

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案详解

第五章 方差分析 课后习题参考答案 5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α) 解:(1)手工计算解答过程 提出原假设:()3,2,10:0==i H i μ 记 167.20812 11112 =???? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.7011 2 11211=???? ??-???? ??=∑∑∑ ∑====r i n j ij r i n j ij i A i i X n X n S 7.137=-=A T e S S S 当 0H 成立时, ()()()r n r F r n S r S F e A --- -= ,1~/1/ 本题中r=3 经过计算,得方差分析表如下: 查表得 ()()35.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原 假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程

从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异?并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3)i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 3.对于各组之间的均值进行检验。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

第10章__方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1. C 2. B 3. A 4. B 5. C 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6. A 7. D 8. D 9. A 10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ· ··k μ> C. <

第10章__方差分析与试验设计

第10章方差分析与试验设计 三、选择题 1.C 2.B 3.A 4.B 5.C 1.方差分析的主要目的是判断()。 A.各总体是否存在方差 B.各样本数据之间是否有显著差异 C.分类型自变量对数值型因变量的影响是否显著 D.分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是()。 A.组间平方和除以组内平方和B.组间均方除以组内均方 C.组间平方除以总平方和D.组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为()。 A.随机误差B.非随机误差C.系统误差D.非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为()。 A.组内误差B.组间误差C.组内平方D.组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 6.A 7.D8.D9.A10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定()。 A.每个总体都服从正态分布B.各总体的方差相等 C.观测值是独立的D.各总体的方差等于0 8.在方差分析中,所提出的原假设是0:=···= ,备择假设是() 12 k A.1:12···kB.1:12···k C. 1:···kD.1:1,2,···,k不全相等 12 9.单因素方差分析是指只涉及()。 A.一个分类型自变量B.一个数值型自变量 C.两个分类型自变量D.两个数值型因变量 10.双因素方差分析涉及()。 A.两个分类型自变量B.两个数值型自变量 C.两个分类型因变量D.两个数值型因变量 11.B12.C

SPSS多因素方差分析

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

多因素方差分析

多因素方差分析

————————————————————————————————作者:————————————————————————————————日期: ?

多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表 表5-7不同温度与不同湿度粘虫发育历期表 相对湿度(%) 温度℃重复 1 234 100 25 91.2 95.0 93.8 93.0 27 87.6 84.7 81.2 82.4 2979.2 67.075.770.6 31 65.2 63.3 63.663.3 8025 93.289.3 95.1 95.5 27 85.8 81.6 81.0 84.4 29 79.0 70.8 67.7 78.8 31 70.7 86.5 66.9 64.9 40 25 100.2103.3 98.3 103.8 27 90.691.7 94.5 92.2 2977.2 85.8 81.779.7 3173.673.2 76.4 72.5 1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。 图5-6数据输入格式

07第七章 假设检验与方差分析 习题答案

第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u ,n x σμ0 -,标准正态; ),(),(2/2/+∞--∞n z n z σ σ αα 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0 μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5. C 6. B 7. C 8. A 9. D 10. A 11. D 12. C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。 1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。 ( × ) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t 检验均可使用,且两者检验结果一致。 ( √ ) 3. 方差分析中,组间离差平方和总是大于组内离差平方和。( × ) 不一定 4. 在假设检验中,如果在显著性水平0.05下拒绝了 00:μμ≤H ,则在同一水平一定可以拒绝假设00:μμ=H 。( × ) 不一定 5. 为检验k 个总体均值是否显著不同,也可以用t 检验,且与方差分析相比,犯第一类错误的概率不变。( × ) 会增加 6. 方差分析中,若拒绝了零假设,则认为各个总体均值均有显著性差异。( × ) 不完全相等 六、简答题 根据题意,用简明扼要的语言回答问题。 1. 假设检验与统计估计有何区别与联系? 【答题要点】 假设检验是在给定显著性水平下,计算出拒绝域,并根据样本统计量信息来做出是否拒

第6讲多因素试验资料的方差分析

第六讲 多因素试验资料的方差分析 M ULTIFACTOR ANALYSIS OF V ARIANCE 多因素试验是指同时研究n 个因素对试验指标的作用,以及它们的共同作用。多因素试验的最大优点首先在于除了一次试验可以同时明确多个因素的效应,还可以分析出因素间的相互作用(互作),便于选定最优处理组合。其次,多因素试验可增加误差项的自由度,降低试验误差。因此比单因素试验精确度更高。最后,多因素实验所得的结论确切、具体、论据充足。如单独进行品种对比试验,结果只能粗略地明确品种间的优劣,如果与饲料水平、饲喂方式结合进行三因素试验,可具体明确用一定的饲喂方式在特定的饲料水平下,哪个品种优于哪个品种。论据、内容都比单因素试验结果丰富。田间试验中也常要考察哪个品种在何时播种以及在何种密度下的产量表现,同时还可以采用区组设计来安排重复,以便控制系统误差,提高试验的准确性。现以三因素试验的资料介绍其方差分析方法。 第一节 线性模型与期望均方 一、线性数学模型 设A 、B 、C 三个因素各含a 、b 、c 个水平,共abc 个处理组合,每个处理组合重复数为r 。则其任一观察值的线性数学模型为: kl j i l ijk jk ik j i k j i kl j i e y +++++++++=ραβγβγαγαβγβαμ)()()()( 其中kl j i l ijk jk ik j i k j i e ,,)(,)(,)(,)(,,,,ραβγβγαγαβγβαμ依次表示总体平均数、A 、B 、C 主效应, A ×B 、A ×B 、B ×C 、A ×B ×C 互作效应,重复(区组)效应和随机误差。在样本资料中依次分别由 ),(,x x x A -)(x x B -,)(x x C -,)(x x x x B A AB +--,)(x x x x C A AC +--,)(x x x x C B BC +--,)(x x x x x x x x BC AC AB C B A ABC ----+++,)(x x R -,)(x x x x R ABC ijkl +--进行估计。B A x x x ,,,,R ABC BC AC AB C x x x x x x ,,,,,分别表示全试验总平均数,A 、B 、C 各水平均数、AB 、AC 、BC 、ABC 处 理组合均数和重复均数。 二、期望均方 三个因素试验的效应按固定模型,随机模型和混合模型的不同其期望均方的组成列于表6—1。 如果试验不采用区组设计,可在表中去掉区组的效应及相应的方差组分。

spssau三因素方差分析操作

三因素方差 当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。 在实验研究中,比如研究者测试某新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,以及男女分别再细分使用新药和普通药物;同时高血压患者对于新药可能有干扰,因而研究者将被试是否患高血压也纳入考虑范畴中。因而最终,X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。因而需要进行三因素方差分析即多因素方差分析。 特别提示: 对于双因素方差,三因素方差分析;SPSSAU单独提供研究方法,并且提供更多指标输 出比如交互效应或图形等; 如果是实验研究,建议使用双因素,或者三因素方差分析等; 针对X超过3个时,只能直接使用多因素方差分析; X均为定类数据,Y为定量数据。 SPSSAU分析结果表格示例如下:

三因素方差案例 Contents 1背景 (2) 2理论 (2) 3操作 (2) 4 SPSSAU输出结果 (4) 5文字分析 (6) 6剖析 (6) 1背景 某研究者测试新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,并且男性或女性中是否高血压患者各为18名,并且当前被试的胆固醇水平基本均保持在6.5左右。最终X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。 同时,明显的可以想到,实验前的胆固醇水平基数,很可能会影响到最终的胆固醇水平,因此“实验前胆固醇水平”是一个干扰因素,因此将其作为协变量纳入模型中。 2 理论 三因素方差分析,通常用于实验研究,如果某个X呈现出显著性,此时可接着使用单因素方差分析或者事后检验,继续对比具体差异情况。 特别提示: 三因素方差时,有可能涉及到交互作用研究(比如二阶效应或三阶效应),SPSSAU默 认不会进行输出,需要主动进行设置; 3因素方差时,共有3个X,因此二阶效应共涉及两两组合,一共为3个二阶交互项; 3因素方差时,共有3个X,3个X只会有一个组合,因而会1个三阶交互项; 针对X超过3个时,只能直接使用多因素方差分析; X均为定类数据,Y为定量数据。 3 操作 本例子中研究3个X对于Y的差异;X分别性别,是否高血压和药物,Y为‘胆固醇水平’,

三因素混合方差分析事后简单效应多重比较语法

概念笔记 Main effect 一个因素的独立效应,即其不同水平引起的方差变异。三因素的实验有三个主效应。把某一因素的一个水平同该因素的其他水平比较,不考虑其他因素。 Interaction 多个因素的联合效应,A因素的作用受到B因素的影响,即有交互——two-way interaction. 当一因素作用受到另外两个因素影响,即三因素交互three-way interaction. 重复测量一个因素的三因素混合设计3*2*2的混合设计 A3*B2*R2 【A, B为被试间因素】 需要分析的有—— A, B, R 各自主效应 二重交互作用,A*B, A*R, B*R 三重交互作用,A*B*C 结果发现, A, B为被试间因素,交互作用SIG 当二重交互作用SIG,需要进行simple effect检验。A因素水平在B因素某一水平上的变异。A在B1水平上的简单效应 A在B2水平上的简单效应 B在A1水平上的简单效应 B在A2水平上的简单效应 B在A3水平上的简单效应 如果三重交互作用SIG,需要进行三因素的简单简单效应分析simple simple effect. 某一因素的水平在另外两个因素的水平结合上的效应 在A1B1水平结合上,R1 与R2 差异 在A1B2水平结合上,R1 与R2 差异 在A2B1水平结合上,R1 与R2 差异 在A2B2水平结合上,R1 与R2 差异 在A3B1水平结合上,R1 与R2 差异 在A3B2水平结合上,R1 与R2 差异

重复测量方差分析之后,如果三重交互作用显著,需要编辑语法, 得出三个因素各自的简单效应 某一因素在其他两个因素的某一实验条件内的简单效应检验 三因素重复测量方差分析对应的会有3种简单效应检验结果 SPSS在输出简单效应检验结果的同时,也会报告多重比较结果,会有更直观的对比结果。 如果三重交互作用SIG,需要进行简单简单效应检验。 固定某两个因素水平组合,考察研究者最感兴趣的那个变量的效应。 MANOV A R1 R2 BY A(1,3) B(1,2) /WSFACTORS=R(2) /PRINT=CELLINFO(MEANS) /WSDESIGN /DESIGN /WSDESIGN=R /DESIGN=MWITHIN B(1) WITHIN A(1) MWITHIN B(2) WITHIN A(1) MWITHIN B(1) WITHIN A(2) MWITHIN B(2) WITHIN A(2) MWITHIN B(1) WITHIN A(3) MWITHIN B(2) WITHIN A(3) 上述语法内容是检验被试内变量R在被试间变量A, B 上的简单简单效应。 如果想检验某一被试间变量A在被试内变量R和另一个被试间变量B上的简单简单效应MANOV A R1 R2 BY A(1,3) B(1,2) /WSFACTORS=R(2) /PRINT=CELLINFO(MEANS) /WSDESIGN /DESIGN /WSDESIGN=MWITHIN C(1) MWITHIN C(2) /DESIGN=A WITHIN B(1) A WITHIN B(2)

相关文档
最新文档