第九章 方差分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第9章方差分析

(Analysis of Variance)

方差分析是指把一种数据的总偏差分解为若干种成分的方法。与其中每一种成分相联系的是某一特殊偏差的来源。通过分析有可能确定每一种偏差来源对总偏差的贡献大小,即在众多的影响因素中,有些影响作用大一些,有些则小些。在现实经济生活中常常需要分析哪几种因素的影响显著,方差分析是解决这一问题的唯一有效的方法。在第八章曾经讨论过两个总体的平均数是否相等的显著性检验问题,但对2个以上的多个总体的平均数是否相等的问题,前面介绍的检验方法无法解决。对这些问题我们采用方差分析来解决。

9.1 单因子方差分析

单因子方差分析是分析一个因子的不同水平对总体的影响的方法。

比如某企业为了推销空调,做了四种不同内容的宣传广告。广告1:强调价格便宜。广告2:强调质量可靠。广告3:强调节能。广告4:强调免费安装和保修。在这个问题中广告是所要检验的因素,四个不同内容的广告可看作是该因素的四个不同的水准的试验。如果以上四种广告内容的宣传对空调销售量的影响没有显著性差异,则从四种广告中任选一种比较经济的广告即可。但是,如果这四种广告对空调销售量的影响有显著性差异,则必须选择对空调的销售量更为有利的方案。

9.1.1 单因子方差分析的资料结构

单因子方差分析是只分析一个因子的不同水平对总体影响的单纯的试验计划法。单因子方差分析至少要对两个水平以上的效果进行比较分析,检验的因子可记作A 。前面所述的四种广告为四个水平,可分别记作4

321,,,A A A A 。每个水平的观测值可以用ij Y 表示。在方

差分析中,当涉及到的因子只有一个时,称为单因子方差分析;涉及的因子有两个时称为双因子方差分析;涉及的因子有两个以上的方差分析,称作多因子方差分析。它具有两个特点; ①各水平的观测值个数不一定相等。 ②各组观测数据必须是,从具有相同方差的相互独立的总体中随机抽样的样本。单因子方差分析的资料结构如

表9-11)。

(表9-1)单因子方差分析的资料结

1)因为每一个观测值的个数不一定相等,所以其观测值数不能用n 表示。为了便于区别通常用n j 表

9.1.2 单因子方差分析数学模型及方差分析表

应用方差分析时需要满足以下两个假设条件;首先,各水平观测值是从服从正态分布的总体中随机抽取的样本。其次,各水平的观测值数据是从相互独立,且具有相同方差的总体中抽取的。

即使是在同一个水平下的观测值之间也有差异,通常这个差异是无法控

制的因素影响的结果。如果不存在这些随机性的影响,则在i A 水平下的各个

观测值都应等于总体的平均数ij Y =i μ。若以ij ε(j =1,2…,n )表示第j 个观测值的随机误差,则对于i A 水平下的单因

子方差分析的数学模型(各观测值)

可按下式表示2)。

ij i ij Y εαμ++=

…(9-1) μμα-=i i … (9-2) (i -代表水平=1,2,…α; j -代表观

测值=1,2,…n )

-ij Y i A 水平下的第j 个观测值

μ-所有i 个总体的平均数

i μ-i A 水平总体平均数(或称第i 个

总体平均数)

i α-i A 水平下各观测值的效应值(或

处理水平)

2)1A 水平下的数学模型的表达式为j j Y 111εαμ++=

ij ε-i A 水平下第j 观测值的随机误

差(相互独立的随机变量)ij ε~ ),0(2σN

i α为第i 个水平下对观测值的效应值或处理效果,它指除去因子对试验指标的平均影响后,因子对试验指标的特殊影响。即,反映因子第i 个水平对观测数据的“纯”作用大小。比如,上述的四种广告宣传对空调销售量的影响中,强调对人体健康无害的广告宣传对销售量的特殊影响。为了确认i 个不同水平总体的平均(处理的平均效果)是否相等,原假设可设为各水平的平均(处理效果)相等。

αμμμ===...:210H …(9-3)

即,各水平的处理效果(各总体的平均)相等的原假设等同于分成几个水平(总体)的处理效果。每个水平i 的观

测值平均数3)i Y 为

3)通常也称作组平均值。

∑==i n j ij i i Y n Y 1

1 (i =1,2,…α; j =1,2,…n i ) …(9-4)

i n - 第i 个总体(第

i 个水平)的样本个数

ij Y

- 第i 个总体第j 个样本的个数

总体的总平均数Y 可按下面的公式计算。

∑=∑∑====αα1

1111i i i i n j ij Y n n Y n Y i …(9-5)

(-n 样本的总数(∑==α

1i i n n ), -i Y 第i 个总体的平均数)

所有观测值ij Y 与总平均数Y 的离差平方和SST 是描述所有样本观测值ij Y 离散程度的指标,被称作总离差平方和。SST 可以分解:

∑∑==-=α121(i n j ij i

Y Y SST )

∑∑==-+-=α12

1)]([(i i n j i ij Y Y Y Y i )

∑∑∑∑∑=====--+-+-=ααα1112121)((2)((i i n j i ij i i i i n j i ij Y Y Y Y Y Y n Y Y i

i )

…(9-6)

由上面的公式(9-1)和(9-4)可知∑∑=--==a i n j i i ij i Y Y Y Y 110

))((,由此可得: ∑∑∑∑∑=====-+-=-a i n j a i a i n j i ij i i ij i i

Y Y Y Y n Y Y 111

11222)()()( …(9-7)

(SST ) (SSTR ) (SSE )

SSTR 是各组平均数i Y 与总平均数Y 离差的平方和,反映了各总体的样本平均数之间的差异程度,通常把SSTR 称做系统误差或组间离差平方和。SSE 是每个样本观测值与其组平均离差的平方和,它反映了样本观测值ij Y 抽样误

差的大小程度的随机误差。通常把SSE

相关文档
最新文档