第九章方差分析60页PPT文档
合集下载
spss第九章方差分析PPT课件

19
多重比较方法
LSD法:实际上就是t检验的变形,只是在变异 和自由度的计算上利用了整个样本信息,因此仍 然存在放大一类错误的问题
Scheffe法:当各水平个案数不相等,或者想进 行复杂的比较时,用此法较为稳妥。但它相对比 较保守
S-N-K法:是运用最广泛的一种两两比较方法。 它采用Student Range 分布进行所有各组均值 间的配对比较。该方法保证在H0真正成立时总 的α 水准等于实际设定值,即控制了一类错误。
2
二,分析目的
方差分析是从数据间的差异入手,分析哪些因素 是影响数据差异的众多因素中的主要因素.
例如: 影响某农作物亩产量的因素(品种、施肥量、气候
等) 影响推销某种商品的推销额(不同的推销策略、价
格、包装方式、推销人员的形象等)
3
三,涉及的概念 (1)观察因素: 观测变量 (2)影响因素:
上述统计量一般十分相近 Pillai最保守,也较稳健,常用
50
应用举例
不同类型地区的居民收入和教育差异分析 பைடு நூலகம்多元单因素方差分析 •总体有差异,单个无差异 •通过Options进行直观比较
51
52
53
54
2020/1/11
55
43
SPSS调用程序: Analyze - General Linear Model -
Univariate
44
Part Seven 3 协方差分析
(1)目的:将无法或很难控制的因素作为协 变量,在排除协变量影响的条件下更精确 地分析控制变量对观察变量的影响.
45
(2)基本思路:
Sum of Squares
df
多重比较方法
LSD法:实际上就是t检验的变形,只是在变异 和自由度的计算上利用了整个样本信息,因此仍 然存在放大一类错误的问题
Scheffe法:当各水平个案数不相等,或者想进 行复杂的比较时,用此法较为稳妥。但它相对比 较保守
S-N-K法:是运用最广泛的一种两两比较方法。 它采用Student Range 分布进行所有各组均值 间的配对比较。该方法保证在H0真正成立时总 的α 水准等于实际设定值,即控制了一类错误。
2
二,分析目的
方差分析是从数据间的差异入手,分析哪些因素 是影响数据差异的众多因素中的主要因素.
例如: 影响某农作物亩产量的因素(品种、施肥量、气候
等) 影响推销某种商品的推销额(不同的推销策略、价
格、包装方式、推销人员的形象等)
3
三,涉及的概念 (1)观察因素: 观测变量 (2)影响因素:
上述统计量一般十分相近 Pillai最保守,也较稳健,常用
50
应用举例
不同类型地区的居民收入和教育差异分析 பைடு நூலகம்多元单因素方差分析 •总体有差异,单个无差异 •通过Options进行直观比较
51
52
53
54
2020/1/11
55
43
SPSS调用程序: Analyze - General Linear Model -
Univariate
44
Part Seven 3 协方差分析
(1)目的:将无法或很难控制的因素作为协 变量,在排除协变量影响的条件下更精确 地分析控制变量对观察变量的影响.
45
(2)基本思路:
Sum of Squares
df
方差分析法PPT课件

计算各样本平均数 y 如i 下:
表 6-2
型号
ABCDE F
yi
9.4 5.5 7.9 5.4 7.5 8.8
•5
引言 方差分析的基本概念和原理
两个总体平均值比较的检验法 把样本平均数两两组成对:
y 1与 y ,2 与y 1 ,…y 3 与 y ,1 与y 6 ,…y ,2 与y 3 ,共有y (5
6.3 显著性检验
利用(6-17)式来检验原假设H0是否成立.对于给定的显著水
平,可以从F分布表查出临界值
A的值.
F(k1,k(再m根1)据),样本观测值算出F
当 FAF(k1,时k(m ,拒1绝))H0,
当 FAF(k1,,时k(m ,接1 受))H0。
即:如果H0成立,F应等于1;相反应大于1,而且因素的影响越大, F值也越大
m
km
T Tj Yij
•38
j1
作统计假设:6种型号的生产线平均维修时数无显 著差异,即
H0: i=0(i=1,2,…,6),H1:i不全为零
•37
6.3 显著性检验
计算SA及SE
k
SA
k
m
i1
(Yi
Y)2
Ti2
i1
m
T2 km
k
km
km
Ti2
SE i1
(Yij Yi)2
j1
i1
j1Yij2i1m
m
Ti Yij
j 1
相当于检验假设
H0 : i 0 (i=1,2,…,k) , H1 : αi不全为零
•29
6.3 显著性检验
可以证明当H0为真时,
ST
2
~2(k
第九章 方差分析ppt课件

首先将总体变异分解成样本组间变异 和由抽样误差等其它原因产生的组内变 异,然后分析变异各组成部分的关系。
如果样本组间变异比抽样误差等其它 原因产生的变异显著地大,则认为样本 组间有本质性的差异,否则,认为样本 组间无本质差异。
精选PPT课件
6
在方差分析中,观测值之间的差异情 况用离差平方和表示,符号为SS。方差分析首先 是把总体平方和分解为组间平方和和组内平方和, 即:
S T S 8 7 8 .8
2.4 78 79 8
组间平方和SS B是指各样本平均数与总体平均
数间的离差平方和,上例为:
SB S ( 4 8.5 5 7.8 8 ) 29 ( 5 8.6 1 7.8 8 ) 29 ( 4 6.7 4 7 5 .8 8 ) 29 ( 5 8.6 2 7.8 8 ) 29 1.0 07 20 8
精选PPT课件
10
组内平方和是指组内每个观测值与本组平 均数间的离差平方和,反映了由抽样误差或 其它未知原因引起的差异,上例为:
SW S8 88.52 8 78.2 12 7 46.7 42 5 8 08.6 22 8 78.6 22
14.7159
ST SSB SSW S
从结果中可看出2489.778=1070.028+1419.75,即
ST SSB SSW S
式中,SST为总平方和; SSB为组间平方和; SSW为组内平方和。
下面举一个简单例子说明什么是总平方和、组间平方 和和组内平方和以及这三者之间的关系。
精选PPT课件
7
某小学科研组为研究教师对学生的 态度是否影响学习成绩,在三年级的四 个班中进行数学教学实验。一班采用表 扬的方法,二班用责备的方法,三班用 放任的方法,四班作为控制班。一段时 间以后进行测验。从各班中分别随机抽 取几份成绩,如下表。问教师对学生的 态度是否影响学生的学习成绩?
如果样本组间变异比抽样误差等其它 原因产生的变异显著地大,则认为样本 组间有本质性的差异,否则,认为样本 组间无本质差异。
精选PPT课件
6
在方差分析中,观测值之间的差异情 况用离差平方和表示,符号为SS。方差分析首先 是把总体平方和分解为组间平方和和组内平方和, 即:
S T S 8 7 8 .8
2.4 78 79 8
组间平方和SS B是指各样本平均数与总体平均
数间的离差平方和,上例为:
SB S ( 4 8.5 5 7.8 8 ) 29 ( 5 8.6 1 7.8 8 ) 29 ( 4 6.7 4 7 5 .8 8 ) 29 ( 5 8.6 2 7.8 8 ) 29 1.0 07 20 8
精选PPT课件
10
组内平方和是指组内每个观测值与本组平 均数间的离差平方和,反映了由抽样误差或 其它未知原因引起的差异,上例为:
SW S8 88.52 8 78.2 12 7 46.7 42 5 8 08.6 22 8 78.6 22
14.7159
ST SSB SSW S
从结果中可看出2489.778=1070.028+1419.75,即
ST SSB SSW S
式中,SST为总平方和; SSB为组间平方和; SSW为组内平方和。
下面举一个简单例子说明什么是总平方和、组间平方 和和组内平方和以及这三者之间的关系。
精选PPT课件
7
某小学科研组为研究教师对学生的 态度是否影响学习成绩,在三年级的四 个班中进行数学教学实验。一班采用表 扬的方法,二班用责备的方法,三班用 放任的方法,四班作为控制班。一段时 间以后进行测验。从各班中分别随机抽 取几份成绩,如下表。问教师对学生的 态度是否影响学生的学习成绩?
应用统计学(第九章 协方差分析)

➢ 均积与均方具有相似的形式,也有相似的性质: 一个变量的总平方和与自由度可按变异来源进行剖分,
从而求得相应的均方; 两个变量的总乘积和与自由度也可按变异来源进行剖分
而获得相应的均积; 把两个变量的总乘积和与自由度按变异来源进行剖分并
获得获得相应均积的方法称为协方差分析。
在随机模型的方差分析中,根据均方MS和期望均方的关 系,可以得到不同变异来源的方差组分的估计值;
b* SP / SP
e
ex
回归关系的显著性可用F检验或t检验,这时误差项目回
归自由度dfeU=1,回归平方和:
U SS b*SP SP2 / SP
e
ey
e
e
ex
误差项离回归平方和:
Q SS U SS SP2 / SS
e
ey
Байду номын сангаасey
ey
e
ex
离回归自由度:
df df df k(n 1) 1
矫正平均数的计算
yi.(xx..) yi . by / x ( xi . x..)
矫正平均数的多重比较
LSD0.05=0.8769, LSD0.01 =1.1718 食欲添加剂配方1、2、3号与对照比较, 其矫正50 日 龄平均重间均存在极显著的差异,配方1、2、3号的矫正50 日龄平均重均极显著高于对照。
回归关系的显著性检验:
变异来源 df 误 差回 归 1 误差离回归 43 误 差 总 和 44
SS 47.49 37.59 85.08
MS 47.49 0.87
F 54.32**
F0.01 7.255
F检验表明,误差项回归关系极显著,表明哺乳仔猪 50 日龄重与初生重间存在极显著的线性回归关系
从而求得相应的均方; 两个变量的总乘积和与自由度也可按变异来源进行剖分
而获得相应的均积; 把两个变量的总乘积和与自由度按变异来源进行剖分并
获得获得相应均积的方法称为协方差分析。
在随机模型的方差分析中,根据均方MS和期望均方的关 系,可以得到不同变异来源的方差组分的估计值;
b* SP / SP
e
ex
回归关系的显著性可用F检验或t检验,这时误差项目回
归自由度dfeU=1,回归平方和:
U SS b*SP SP2 / SP
e
ey
e
e
ex
误差项离回归平方和:
Q SS U SS SP2 / SS
e
ey
Байду номын сангаасey
ey
e
ex
离回归自由度:
df df df k(n 1) 1
矫正平均数的计算
yi.(xx..) yi . by / x ( xi . x..)
矫正平均数的多重比较
LSD0.05=0.8769, LSD0.01 =1.1718 食欲添加剂配方1、2、3号与对照比较, 其矫正50 日 龄平均重间均存在极显著的差异,配方1、2、3号的矫正50 日龄平均重均极显著高于对照。
回归关系的显著性检验:
变异来源 df 误 差回 归 1 误差离回归 43 误 差 总 和 44
SS 47.49 37.59 85.08
MS 47.49 0.87
F 54.32**
F0.01 7.255
F检验表明,误差项回归关系极显著,表明哺乳仔猪 50 日龄重与初生重间存在极显著的线性回归关系
第九章----方差分析

若组间变异明显大于组内变异, 则不能认为组 间变异仅反映随机误差的大小, 处理因素也在起 作用。根据计算出的检验统计量F值, 查界值表 得到相应的P值, 按所取检验水准α作出统计推断 结论。
检验统计量F值服从F分布。
F<Fα,(ν组间, ν组内),则P > α, 不拒绝H0, 还不能认 为各样本所来自的总体均数不同;
1、各样本是相互独立的随机样本, 且来自 正态分布的总体;
2、相互比较的各样本的总体方差相等, 即 具有方差齐性。 独立性、随机性、正态性、方差齐性
五、方差分析的用途
1、用于进行两个或多个样本均数的比较; 2、分析两因素或多因素间的交互作用; 3、用于回归方程的线性假设检验。
六、方差分析的优点
1、不受比较组数的限制,可比较多组均数; 2、可同时分析多个因素的作用; 3、可分析因素间的交互作用.
一、多个样本均数间的比较能否用 t 检 验或 u 检验?为什么?
原因:
五个样本均数进行比较, 每次两个均数作一次 t 检验, 共需作10(C52=10)次 t 检验。若每次比 较的检验水准α=0.05, 则每次比较不犯Ⅰ型错误 的概率为(1-α)=0.95。当这些检验独立进行 时, 则10次比较均不犯Ⅰ型错误的概率为0.9510= 0.5987, 此时犯Ⅰ型错误的概率, 即总的检验水准 α变为1-0.5987=0.4013比0.05大的多。犯Ⅰ型错 误的概率增大, 可能将原本无差别的两个总体推 断为有差别, 误判为有统计意义。因此多重比较 不宜用的 t 检验或 u检验作两两比较。
已知各组均数、标准差和样本含量时F值 的简便计算方法。
当原始数据未知, 只知各组均数、标准差和 样本含量时, 可进行如下计算, 分两种情况: 1、各组样本含量ni相等; 2、各组样本含量ni不等。
现代心理与教育统计学第九章:方差分析

(五)查F分布临界值做出判断 当dfB=2, dfW=9,设定p=0.01, 查表F0.01(2,9)=8.02,检验值是F=48.44>8.02,p<0.01。
F0.01(2,9)=8.02
(六)陈列方差分析表
变异来变源异来平源方和平方自和由度自由度均方 均方 F F p 组间 组间258.67258.672 2 129.34129.3448.4448.44*0*.01 组内 组内 24 24 9 9 2.67 2.67
组内变异区组变异msr误差变异mse由此总变异的构成由原来的两个部分演变为三个部分总变异组间或处理变异区组变异误差变异组间设计下自变量各水平下被试随机区分而在单因素组内把每个水平下被试进行了等级划分形成了组内效应区组效应
第九章 方差分析
第一节 方差分析基本原理及步骤 第二节 完全随机设计的方差分析
目 录
第三节 随机区组设计的方差分析
第四节 事后检验
第一节 方差分析基本原理及步骤
➢ 补充: 自变量(前因变量);自变量水平 因变量(后果变量) 组间(被试间)实验设计(自:男,女。因:红色反应时) 组内(被试内)实验设计(自:红,绿。因:男红绿反应时) 混合实验设计(自:男,女;红,绿。因:男女红绿反应时) 实验组、对照组
SB S n X2 nX k2(2470 444 0 6 4 0)4 (5 3 2 2 4 0 8)2
79 6240 20 5 .68 7 12
SW S X 2 n X 2 8 1 76 9 22 4
(二)自由度的分解 总自由度为总容量减去1。本例有12个数据,所以:
思考: 1.如果想要分析A总体和B总体平均数的差异,可以用什么方法
方差分析(共66张PPT)
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 7.19
基本步骤
(1)建立假设,确定检验水准
H0:三个总体均数相等,即三组工作人员的 体重指数总体均数相等
单因素方差分析
例1 在肾缺血再灌注过程的研究中,将36只雄性大鼠随机等分成三组, 分别为正常对照组、肾缺血60分组和肾缺血60分再灌注组,测得 各个体的NO数据见数据文件,试问各组的NO平均水平是否相同?
单因素方差分析
分析:
对于单因素方差分析,其资料在SPSS中的数据结构应当由两 列数据构成,其中一列是观察指标的变量值,另一列是用以表 示分组变量。实际上,几乎所有的统计分析软件,包括SAS, STATA等,都要求方差分析采用这种数据输入形式,这一点也暗 示了方差分析与线性模型间千丝万缕的联系。
H1:三个总体均数不等或不全相等
(2)计算检验统计量F值
变异来源
SS 自由度(df)
MS
F
组间 组内 总变异
143.406 363.86 507.36
2
71.703
8.87
45
8.09
47
(3)确定p值,作出统计推断
,本次F值处于F界值之外,说明组间均方组内 均方比值属于小概率事件,因此拒绝H0,接受 H1,三个总体均数不等或不全相等
分凝血活酶时间有无不同?
方差分析步骤 :
(1)提出检验假设,确定检验水准
H0:μ1=μ2=μ3 H1:μ1,μ2,μ3不全相同 a=
方差分析 (共72张PPT)
2.总体变异的构成
总体变异 组间变异: 组内变异:组内变异理论上要求齐性,实际计算取其 均值
3.方差的基本公式
一般总体方差称方差,样本方差称均方 能使变量发生变异的原因很多,这些原因我们都将其称为变异
因素或变异来源。
方差分析就是发现各类变异因素相对重要性的一种方法
方差分析的思路就是:把整个试验(设有 k 个总体)的样本资料作 为一个整体来考虑。
原理是变异的可加性。
即每一个数据与数据的总体平均数差的平方和,可以分解为每一组数 据各自的离差平方和与由各组数据的平均数组成的一组数据的
离差平方和两部分。前者表达的是组内差异,即每组数据中 各个数据之间的差异,也就是个体差异,表达的是抽样误差或 随机误差程度;后者表达的是组间差异,即各组平均数之间的差 异,表达的是实验操纵的差异程度,实验操纵即指自变量的操 纵,这两部分差异之间相互独立。
3、这种两两比较会随着样本组数的增加而加大犯Ⅰ型错的差异显著性检验,若两两比较推 断正确的概率为95%,则所有比较都正确的概率为6=0.74,则降低
了推断的可靠性。
• 几个常用术语:
1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低 ,在试验中具体测
(1).计算平方和:
组间平方和
SB SX n2X n2 71 .5 6 65 8 .1 7 8 20 8 .47
¨ 组内平方和
SW SX 2X n2 7 6 7 41 4 .5 6 4 45 7 .5 7 8
¨ 总平方和
SS T X 2X n2
764414252 876.396
23
(2).计算自由度
因此,方差分析可以帮助我们抓住试验的主要矛盾和技术关键,发 现主要的变异来源,从而抓住主要的、实质性的东西。
心理与教育统计学课件(张厚粲版)ch9方差分析
6
三、方差分析的步骤
⑴建立假设: H 0 : µ1 = µ 2 = L = µ K
H1 : 至少有一对平均数差异显著
⑵求F值: ①求平方和:即求组间平方和,组内平方和及总平 方和 ②求自由度: df B = K − 1; df W = K (n − 1); df t = Kn − 1 ③求方差(均方): SS B SSW
8
四、方差分析的基本条件
㈠总体服从正态分布 变异的可加性(变异的相互独立性) ㈡变异的可加性 ㈢变异的同质性:即各组的变异是相等的,或者说各组的方 变异的同质性: 差彼此无显著差异。
(σ
2 1
2 2 =σ2 =L=σK )
变异的同质性(齐性) 检验常用哈特莱( Hartley ) 最大 F比率法。即: Fmax =
20
均方 950.1 251.9
F值 3.77*
第二节 完全随机设计的方差分析
三、利用样本统计量进行方差分析
k
∑nj X j
1 .总平均数 : X =
j =1 k
∑nj
j =1
2.因素平方和 : SS B = 3.误差平方和 : SS w =
∑ n j (X j − X t )
k j =1 k
2
∑ n jS 2 j
第九章 方差分析
方差分析又称做变异数分析(缩写 ANOVA),它是一种应用非常广泛的变量分 析方法。其作用就是对引起方差变化的各种因 素进行分析和比较,从而确定各个因素对因变 量是否有显著的影响。 方差分析可以像Z检验一样用来比较两个 或两个以上平均数的差异。但是,它与Z检验 相比具有以下优点:①功效高。Z检验一次只 能比较两个平均数,而方差分析一次可以比较 多个平均数的差异。②功能强。Z检验只能分 析,比较单因素实验结果,对于多因素实验的 交互作用以及同时比较各个因素作用的大小则 无能为力。
三、方差分析的步骤
⑴建立假设: H 0 : µ1 = µ 2 = L = µ K
H1 : 至少有一对平均数差异显著
⑵求F值: ①求平方和:即求组间平方和,组内平方和及总平 方和 ②求自由度: df B = K − 1; df W = K (n − 1); df t = Kn − 1 ③求方差(均方): SS B SSW
8
四、方差分析的基本条件
㈠总体服从正态分布 变异的可加性(变异的相互独立性) ㈡变异的可加性 ㈢变异的同质性:即各组的变异是相等的,或者说各组的方 变异的同质性: 差彼此无显著差异。
(σ
2 1
2 2 =σ2 =L=σK )
变异的同质性(齐性) 检验常用哈特莱( Hartley ) 最大 F比率法。即: Fmax =
20
均方 950.1 251.9
F值 3.77*
第二节 完全随机设计的方差分析
三、利用样本统计量进行方差分析
k
∑nj X j
1 .总平均数 : X =
j =1 k
∑nj
j =1
2.因素平方和 : SS B = 3.误差平方和 : SS w =
∑ n j (X j − X t )
k j =1 k
2
∑ n jS 2 j
第九章 方差分析
方差分析又称做变异数分析(缩写 ANOVA),它是一种应用非常广泛的变量分 析方法。其作用就是对引起方差变化的各种因 素进行分析和比较,从而确定各个因素对因变 量是否有显著的影响。 方差分析可以像Z检验一样用来比较两个 或两个以上平均数的差异。但是,它与Z检验 相比具有以下优点:①功效高。Z检验一次只 能比较两个平均数,而方差分析一次可以比较 多个平均数的差异。②功能强。Z检验只能分 析,比较单因素实验结果,对于多因素实验的 交互作用以及同时比较各个因素作用的大小则 无能为力。
L2-第九章 方差分析
总 N 1 24 1 23
SS处理 ni X i X X i ni C
2 2 i
550.012 537.30 2 618.19 2 726.282 246398.0820 6 6 6 6 3742.5521
在实际运用中,往往将上述过程总结为如下的方差分析
表。
二、方差分析的应用条件 进行方差分析时,数据应满足以下两个应用条件: 1. 各样本是相互独立的随机样本,均服从正态分布。 当样本含量较小时,资料是否来自正态分布的总体难 于进行直观判断和检验,常常根据过去的经验;当样 本含量较大时,无论资料是否来自正态分布总体,数
变异、区组的变异和随机误差三个部分。
数理统计可以证明它们有如下的数量关系。
SS总 SS处理 SS区组 SS误差
总 处理 区组 误差
具体计算公式见下表:
二、随机区组设计资料方差分析的基本步骤 随机区组设计资料的方差分析步骤概括如下: ①. 建立假设 对于处理组 H0:4个总体均数全相等 H1:4个总体均数不等或不全相等 对于区组 H0:6个总体均数全相等 H1:6个总体均数不等或不全相等
bk个格子中,每个格子仅有一个数据Xij(i=1,2,3,,k; j=1,2,3,,b), 而无重复,因此其方差分析属无重复数据 的双向(因素)方差分析(two-way ANOVA)。
一、离均差平方和与自由度的分解 从该例数据表可以看出,随机区组设计资料的总变异 可以分解为:除处理的变异、随机误差外,还可分离 出区组变异。 区组变异 为6个不同窝别家兔血糖浓度值的样本均数
X j 各不相同,即 X j 与总均数 X 的不同。它既包含6个
区组的差异,也包含随机误差,其大小可用区组均方
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 我们要研究的问题是诸不同品种的平均亩产 量是否有显著差异.
• 在本例中只考虑品种这一因子对亩产量的影响, 五个不同品种就是该因子的五个不同水平.由于同 一品种在不同田块上的亩产量不同,我们可以认为 一个品种的亩产量就是一个总体,在方差分析中总 假定各总体独立地服从同方差正态分布,即第i个品 种的亩产量是一个随机变量,它服从分布N(μi,σ2), i=1,2,3,4,5.
r ni
r
(XijXi.2 ) ni(Xi.X)2
i1j1
i1
其中交叉乘积项
r n i
r
n i
2 (X ij X i.() X i. X ) 2(X i. X ) (X ij X i.)
i 1j 1
i 1
j 1
r
2 (Xi.X)(Xi.tXi.)0 i1
r ni
记SE
(Xij Xi.)2
r
由nr (ni 1)及2分布的可加性知
§1 单因子方差分析
§1.1 基本概念
为了考察某个因素 A 对试验指标(即随机变量 X)
的影响,在试验时,保持其他因素不变,而仅让因素 A
改变,这种试验称为单因子(单因素)试验. 设试验结
果如下表:
水平
观测值
A1
x11
x12
...
x1n1
A2
x21
x22
…
x2n2
…
…
…
…
…
Ar
xr1
xr2
…
xrnr
• 由于Xij~N(μi,σ2) ,故Xij与μi的差可以看成一个随机 误差εij~N(0,σ2) .这样一来,可以假定Xij具有下述数据 结构式:
Xij= μi+ εij,i=1,2,...,r;j=1,2,...,ni 其中诸εij~N(0,σ2),且相互独立.要检验的假设是
H0:μ1=μ2=…=μr
划诸Xij之间的波动,并把引起波动的两个原因用另 两个量表示出来,这就是方差分析中常用的平方和
分解法.
通常X用 ij与样本总X平 之均 间的偏差平方
反映 Xij之间的波 .令动
r ni
ST
(Xij X)2
i1 j1
其中 X 1 r
n i1
ni
Xij
j1
ni
令 X i. X ij, j 1
X i.n 1 i jn i1X ij
i1 j1
的离差平方,是和描述全部数据离度散的程一个
指标,称为总偏差平(方 总和 离差平方).和
r ni
SE
(Xij Xi.)2表示每个数据与其均组值平
i1 j1
的离差平方,反和映了试验中的随差机 ,称误为误差
偏差平方(组 和内离差平方 ). 和
r
SA ni(Xi.X)2表示组平均值与值总的平离均差 i1
r n i
r n i
则 S T (X ij X )2 (X ij X i. X i. X )2
i 1j 1
i 1j 1
r n i
r n i
r n i
(X i jX i.2 ) (X i. X ) 2 2 (X i jX i.(X )i. X )
i 1j 1
i 1j 1
i 1j 1
r
ni i 0
i 1
所要检验的假设可以写成:
H 0: 1 2 .. . r 0
• 为了导出检验假设的统计量,下面我们分析一下 什么是引起诸Xij 波动的原因.
§1.2 平方和分解公式
• 引起诸Xij 波动的原因有两个:一个是假设H0为真
时,诸Xij的波动纯粹是随机性引起的;另一个可能是
假设H0不真而引起的.因而我们就想用一个量来刻
i1 j1
r
SA ni(Xi.X)2 i1
则ST SESA 为一个平方和 . 分解式
下面我们来看各式的意义
X1 r
ni1
ni
Xij是所有数据,称 的为 平总 均平 值 . 均
j1
Xi.n1i
ni j1
Xij是从i第 个总体中抽得的 均样 值 ,称本平
为组平均 . 值
r ni
ST
(Xij X)2表示所有数据与总值平均
其中S 2是全体样本的样本方差.
故 ST 2(n 1 2 )S2~2(n 1 )
Hale Waihona Puke 于各组样本有ni(XijXi.)2 (ni 1)Si2
j1
其中ni是第i组样本的样本容量
Si2是第i组样本的样本方差
因此 (ni 1 2)Si2~2(ni1)i,1,2,,r
且各组样 S12,本 S22,方 ,Sr2相 差互.独立
• 在实际问题中影响总体均值的因素可能不止一 个.我们按试验中因子的个数,可以有单因子方差分 析,双因子分析,多因子分析等.例中是一个单因子方 差分析问题.
• 设在某试验中,因子A有r个不同水平A1,A2,...,Ar, 在Ai水平下的试验结果Xi服从正态分布 N(μi,σ2),i=1,2,...,r,且X1,X2,...,Xr间相互独立.现在 水平Ai下做了ni次试验,获得了ni个试验结果 Xij,j=1,2,...,ni这可以看成是取自Xi的一个容量为ni 的样本,i=1,2,...,r.
• 例:为寻求适应本地区的高产油菜品种,今选了 五种不同品种进行试验,每一品种在四块试验田上 得到在每一块田上的亩产量如下:
品种 田块
1 2 3 4
A1
256 222 280 298
A2
244 300 290 275
A3
250 277 230 322
A4
288 280 315 259
A5
206 212 220 212
• 为了今后方便起见,把参数的形式改变一下,并记
1 n
r i1
nii
r
nni i1
i i , i 1,2,...,r,
称μ为一般平均,αi为因子A的第i 个水平的效应.
• 在这样的改变下,单因子方差分析模型中的数据 结构式可以写成:
X i j i i,j i 1 ,2 ,.r ;.j .1 ,2 ,,.n i..,
平方,和 反映了各(因 总子 体 A的不同水 )均平值之间的
差异程,称 度为因子偏差(组 平间 方离 和差平).方和
§1.3 检验统计量的构造
当 H 0:12 .. .n 0 为,一 真 X ij~ 切 时 N (, 2 ),
且相 . 互独立
r ni
ST (XijX)2(n1)S2 i1 j1
• 试验的目的就是要检验假设
H0:μ1=μ2=μ3=μ4=μ5
是否成立.若是拒绝 ,那么我们就认为这五种品种 的平均亩产量之间有显著差异;反之,就认为各品种 间产量的不同是由随机因素引起的.方差分析就是 检验假设的一种方法.
• 实际上,方差分析是检验同方差的若干正态总体均 值是否相等的一种统计方法.