第七章 方差分析.

第七章  方差分析.
第七章  方差分析.

第七章方差分析

方差分析(analysis of variance)是检验多个总体均值是否相等的统计方法。目的:通过检验多个总体的均值是否相等来判断定类变量对定距变量是否有显著影响。

第一节方差分析引述

一、方差分析的基本思想和原理

例1:想了解四个行业的服务质量如何,得到以下数据:

消费者对四个行业的投诉次数

自变量行业是分类变量,因变量被投诉次数是定距变量。

想知道行业对被投诉次数的影响,就要分析不同行业的被投诉次数之间是否有显著差异,即检验四个行业被投诉次数的总体均值是否相等(注意不是样本均值)。如果相等,行业对投诉次数无影响;如果均值不全相等,有影响。

为什么不用均值检验的方法?

均值检验一次只研究两个样本,要检验4个总体均值是否相等,需要6次检验(1-2,1-3,1-4,2-3,2-4,3-4)。每次检验犯第一类错误的概率是α,作多次检验会增加犯错概率和降低置信水平。而方差分析同时将所有样本信息结合在一起,增加了分析的可靠性,降低了犯错的概率,避免拒绝真实的原假设。如何用样本均值检验总体均值即判断行业对投诉次数是否有影响?

各行业被投诉次数的样本均值不相等,是否可说明不同行业被投诉次数有明显差异?不一定,也许各行业总体均值无差异,仅仅因为抽样的随机性造成了彼此之间的差异/随机误差。(来自同一个总体的各个样本之间因为随机性而造成的均值差异和来自不同总体的样本之间的均值差异在散点图上是有差异的。)所以,方差分析就是对于差异来源进行分析(来源于随机误差还是不同总体间的真实差异),从而判断不同总体均值是否相等。

在例1中,在同一行业(同一总体)下,样本的各观测值不同,其差异可看作抽样的随机性造成的,称之为随机误差。在不同行业(不同总体)下,各观测

值也是不同的,这种差异可能是由于抽样的随机性造成的,也可能是由于行业本身的不同而造成的系统误差。

衡量同一行业下样本数据的误差,称为组内误差;衡量不同行业下样本之间的误差,称为组间误差。组内误差只包括随机误差,组间误差既包括随机误差也包括系统误差。如果行业对投诉次数没有影响,组间误差里就只包含随机误差而没有系统误差。这时,组间误差与组内误差的比值应接近1;反之,如果行业对投诉次数有影响,组间误差中除随机误差外还有系统误差,组间误差与组内误差之比就应该大于1。当这个比值达到某种程度时,就可以说不同行业的投诉次数之间有显著差异,即行业对投诉次数有显著影响。

二、方差分析的基本假定

1、自变量每一个取值对应的分布都应服从正态分布,以例1为例,每个行业的投诉次数都应服从正态分布。

2、自变量每一个取值对应的分布都应有相等的方差,即自变量的各组数据是从具有相同方差的正态总体中抽取的。注意,仅要求总体方差相等,而非样本方差。通常自变量各组数据的样本方差中最大值不超过最小值的二三倍,就可以视为等总体方差。

3、观测值是独立的。每个被抽中企业被投诉次数与其它企业被投诉次数的次数是独立的。

三、问题的提法

设自变量共有m类,每类的总体均值分别用μ

m

表示,要检验m类总体均值是否相等,需要提出以下假设:

H 0:μ

1

2

=….=μ

m

,自变量对因变量没有显著影响

H 1:至少有一个以上的类别均值不等或μ

1

、μ

2

….μ

m

不全相等。

第二节一元方差分析

分析一个分类型自变量对数值型因变量的影响时使用一元方差分析/单因素方差分析。

一、数据结构

设自变量A共分m类,A

1,A

2

,..,A

m

。现从A

1

类中随机抽取n

1

个,A

2

类中随机

抽取n

2个,……,从A

m

类中随机抽取n

m

个(n

1

, n

2

,…n

m

可以不等),根据各个观

测值可得到如下统计表:

二、分析步骤 1、提出假设

2、构造检验统计量

(1)计算各样本均值1

1

ni

ij

j i

yi y

n ==

(2)计算全部观测值的总均值11111m ni m

ij i i j i y y n yi n n =====∑∑∑

(3)计算误差平方和

①总误差平方和TSS :全部观测值与总均值的误差平方和,反映了全部观测量的离散状况,

TSS=211()m

ni

ij i j y y ==-∑∑;

根据例1计算:TSS=(57-47.9)2+…..+(58-47.9)2≈4164.6 ②组内误差平方和RSS RSS=211()m

ni

ij i j y yi ==-∑∑

根据例1:零售业组内误差平方和=(57-47.9)2+(66-47.9)2+….+(44-49)2=700,

同理,旅游业924,民航业434,制造业650,RSS=700+924+434+650=2708 ③组间误差平方和BSS

BSS=2

11

()m ni i j yi y ==-∑∑=21

()m

i i n yi y =-∑(注意要乘以n i )

根据例1计算:BSS=7(49-47.9)2+6(48-47.9)2+5(35-47.9)2+5(59-47.9)2=1456.6

三个误差平方和的关系:TSS= RSS+BSS

总结:BSS 是对随机误差和系统误差大小的度量,可以反映自变量对因变量的影响;RSS 是对随机误差大小的度量,反映了除自变量对因变量的影响外,其他因素对因变量的总影响,也称残差变量;TSS 是对全部数据总误差程度的度量,反映了自变量和残差变量的共同影响。

如果原假设成立μ1=μ2=….=μm ,则表明没有系统误差,BSS 除以其自由度后的均方与RSS 除以其自由度后的均方(即方差)就不会有太大差异(为何要除以自由度?因为误差平方和大小与观测值多少有关);如果组间均方明显大于组内均方,说明自变量各水平之间的差异不仅有随机误差,还有系统误差。所以,判断自变量对因变量的影响就是要比较组内均方与组间均方之间的差异大小。 (4)计算统计量

TSS 的自由度为(n-1),n 表示全部观测值数量 BSS 的自由度为 (m-1),m 表示自变量的类别 RSS (n-m),(n-1)-(m-1)

BSS 的均方BSS =BSS/ (m-1);RSS 的均方RSS = RSS/(n-m),

检验统计量F=BSS /RSS ~F (m-1,n-m )(要比较的是组间均方和组内均方的差异) 当原假设为真时,二者比值服从第一自由度为m-1,第二自由度为n-m 的F 分布。 根据例1计算:F= /(1)/()BSS m RSS n m --=1456.6/(41)

2708/(234)

--≈3.407

3、统计决策

计算出F 值后,将其与给定的显著性水平α的临界值相比较,从而做出对原假设的决策。在对F 值进行检验时的原假设是BSS /RSS =1,备选假设是

BSS /RSS >1。

根据给定的显著性水平,在F 分布表上查找与第一自由度m-1,第二自由度n-m 相对应的临界值F α(m-1,n-m)。如果F >F α,则拒绝原假设,表明自变量对因变量有显著影响;如果F <F α,则不能拒绝原假设,没有数据表明自变量不同水平的总体均值有显著差异,所以不能认为自变量对因变量有显著影响。

根据例1计算出F=3.407,假定α=0.05,查F 分布表得到F 0.05(3,19)=3.13。由于F=3.407>3.13,所以拒绝原假设,表明行业对被投诉次数有显著影响。

4、方差分析表

三、关系强度的测量——相关比率

方差分析表明,组间平方和与残差平方和的比例反映了自变量行业与因变量被投诉次数的关系,当组间平方和比残差平方和大,且达到一定程度时,就意味着自变量和因变量的关系显著,大的越多,关系越强。如何判断自变量与因变量的关系强度?可用组间平方和(BSS )及残差平方和(RSS )占总平方和(TSS )的比例大小来反映。

其中,E 2=BSS/TSS ,算术平方根E 可用来表示两个变量之间的关系强度。 可用消减误差比例原理PRE=(E 1-E 2)/E 1来解释。E 1是不知道因变量与自变量有关时预测y 所犯的错误,这时使用样本总平均值来预测y ,错误大小为TSS=211()m

ni

ij i j y y ==-∑∑。E 2为知道因变量与自变量有关后,预测y 时犯的错误,这

时使用自变量各组均值来预测的,错误大小为RSS=211

()m ni

ij i j y yi ==-∑∑。E 1-E 2反映了

知道自变量与y 相关后减小的预测错误。所以E 2=(TSS-RSS)/TSS=BSS/TSS 。

根据例1计算:E 2=BSS/TSS=1456.6/4164.6=0.351277=35.1277%;E=0.592686 解释:行业可以解释被投诉次数差异的35.1277%,其他因素所解释的比例占64.8723%;行业与被投诉次数之间有较强相关关系。

第二节 二元方差分析

一、二元方差分析的类型

分析两个定类自变量对定距变量的影响时,需要用二元方差分析。 例2:有四个品牌的彩电在五个地区销售,为分析品牌和地区对销售量是否有影响,对每个品牌在各个地区的销售量取得以下数据,分析品牌和地区对销售量是否有显著影响?(α=0.05)

在二元方差分析中,如果两个因素对因变量的影响是独立的,称为无交互作用的二元方差分析;如果两个因素对因变量的影响除了各自的单独影响之外,两个因素相互之间的关系还会对因变量产生新的影响,就称为有交互作用的二元方差分析,或可重复的二元方差分析。

二、无交互作用的二元方差分析/无重复情况下的二元方差分析 1、数据结构

获取数据时,将一个因素安排在行,另一个因素安排在列。设行因素有a 个类别,列因素有b 个类别,行因素和列因素的每一个类别都可搭配成一组,观测它们对因变量的影响,共抽取ab 个观察数据,如下表:

方差分析的基本假定:每一个观测值都可看作由行因素的a 个类别和列因素的b 个类别所组合成的ab 个总体中抽取的容量为1的独立随机样本。这ab 个总体中的每一个总体都服从正态分布,且有相同的方差。

i y ?是行因素的第i 个类别下各观测值的平均值,j y ?是列因素的第j 个类别下个观测值的平均值;y 是全部ab 个样本数据的总平均值。 2、分析步骤 (1)提出假设

行因素的假设:

H 0:μ1=μ2=….=μa , 行因素对因变量没有显著影响 H 1:μi (i=1,2,…,a)不全相等 行因素对因变量有显著影响

列因素的假设:

H 0:μ1=μ2=….=μb , 列因素对因变量没有显著影响 H 1:μj (j=1,2,…,b)不全相等 列因素对因变量有显著影响 (2)构造检验统计量

分别确定检验行因素和列因素的统计量。 TSS=211()a

b

ij i j y y ==-∑∑

=

2

11

()a b

i i j y

y ?==-∑∑+2

11

()a b j i j y y ?==-∑∑+2

11

()a b

ij i j

i j y y y y ??==--+∑∑ 分解后的第一项是行因素所产生的误差平方和,记为BSS A ,反映了行变量对因变量的影响;第二项是列因素所产生的误差平方和,记为BSS B ,反映了列变量对因变量的影响;第三项是除去行因素和列因素之外的剩余因素影响产生的误差平方和,即随机误差平方和,记作RSS ,反映了随机因素对因变量的影响。

BSS A =211()a

b

i i j y y ?==-∑∑

BSS B =211()a

b j i j y y ?==-∑∑

RSS=211

()a

b

ij i j i j y y y y ??==--+∑∑

TSS= BSS A +BSS B +RSS

在误差平方和基础上,计算各自均方。与各误差平方和相对应的自由度:TSS 的自由度为ab-1;BSS A 的自由度为a-1;BSS B 的自由度为b-1;RSS 的自由度为(a-1)(b-1)。

A BSS = BSS A /(a-1) ;

B BSS = BSS B /(b-1);RSS = RSS/(a-1)(b-1) 为检验行因素对因变量的影响是否显著,采用下面的检验统计量: F A =A BSS /RSS ~F 【(a-1), (a-1)(b-1)】

为检验行因素对因变量的影响是否显著,采用下面的检验统计量: F B =B BSS /RSS ~F 【(b-1), (a-1)(b-1)】 (3)统计决策

根据给定的显著性水平和两个自由度,查F 分布表得到相应的临界值F A α、F B α,然后将F A 和F B 与F A α、F B α作比较。

若F A >F A α,则拒绝原假设H 0:μ1=μ2=….=μa ,表明μi 之间的差异显著,

即有1-α的把握度认为所检验的行因素对因变量有显著影响。

若F B >F B α,则拒绝原假设H 0:μ1=μ2=….=μb ,表明μj 之间的差异显著,即有1-α的把握度认为所检验的列因素对因变量有显著影响。

方差分析表:

根据例2中的数据,分析品牌和地区对销售量是否有显著影响?(α=0.05) 解:成立假设:

行因素:

H 0:μ1=μ2=μ3=μ4, 品牌对因变量没有显著影响 H 1:μ1、μ2、μ3、μ4不全相等 品牌对因变量有显著影响 列因素:

H 0:μ1=μ2=μ3=μ4=μ5, 地区对因变量没有显著影响 H 1:μ1、μ2、μ3、μ4、μ5不全相等 地区对因变量有显著影响 计算过程复杂,可利用SPSS 或Excel 软件计算结果。

由于F A =18.108>F A α=3.49,所以拒绝原假设,表明品牌对因变量有显著影响。由于F B =2.1<F B α=3.259,所以不能拒绝原假设,不能认为地区对销售量有显著影响。 关于概值的概念:

SPSS 对假设检验的输出结果当中的“Sig ”,表明对原假设的拒绝把握,在方差分析中表明变量间相关关系的显著性水平,称为概值,用p 表示。p 越小,越能够拒绝原假设,说明变量相关关系越显著,通常有*P <0.10,**P <0.05,***P <0.01,****P <0.001。

三、有交互作用的二元方差分析/重复情况下的二元方差分析

例3:城市道路交通管理部门为了研究不同的路段和时段对行车时间的影响,让一名交警分别在两个路段和高峰期与非高峰期亲自驾车试验,共获得20个行程时间(分钟)数据,试分析路段、时段以及路段和时段的交互作用对行车时间的影响。(α=0.05)

设列变量A 有a 种分类,例3中为两种:路段1和路段2。行变量B 有b 种分类,例3中有两种:高峰期和非高峰期。对AB 的每一种搭配各进行r 次重复独立观测,例3中为观测5次。观测数据总数n=abr 。 (1)提出假设

对行变量、列变量和交互作用变量分别提出假设,与前面相似。也可以设原假设为:某变量的效果为零;备选假设为:某变量的效果不为零。 (2)构造检验统计量

总平方和:TSS= 2

()ijk i

j

k

y y -???∑∑∑= BSS A +BSS B +I A ×B +RSS

行平方和:BSS B = 2

()j i

j

k

y y ??-???∑∑∑

列平方和:BSS A = 2

()i i

j

k

y y ??-???∑∑∑

交互作用平方和:I A ×B =2

()ij i j i

j

k

y y y y ?????--+???∑∑∑

误差项平方和:RSS =2

()

ijk ij i

j

k

y y ?-∑∑∑

(3)决策分析

根据例3的数据,由SPSS输出的结果:

*P<0.10,**P<0.05,***P<0.01,****P<0.001

解释:时段对开车时间有显著影响;路段对开车时间有显著影响;时段和路段的交互作用变量对开车时间没有显著影响。

第七章_假设检验与方差分析习题答案

第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,进行统计检验时预先建立的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:通过对数据总变异进行分解,来检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u ,n x σμ0-,标准正态; ),(),(2/2/+∞--∞n z n z σσ αα 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0 μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r

18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5. C 6. B 7. C 8. A 9. D 10. A 11. D 12. C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。 1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。 ( × ) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t 检验均可使用,且两者检验结果一致。 ( √ ) 3. 方差分析中,组间离差平方和总是大于组内离差平方和。( × ) 不一定 4. 在假设检验中,如果在显著性水平0.05下拒绝了 00:μμ≤H ,则在同一水平一定可以拒绝假设00:μμ=H 。( × ) 不一定 5. 为检验k 个总体均值是否显著不同,也可以用t 检验,且与方差分析相比,犯第一类错误的概率不变。( × ) 会增加 6. 方差分析中,若拒绝了零假设,则认为各个总体均值均有显著性差异。( × ) 不完全相等 六、简答题 根据题意,用简明扼要的语言回答问题。 1. 假设检验与统计估计有何区别与联系? 【答题要点】 假设检验是在给定显著性水平下,计算出拒绝域,并根据样本统计量信息来做出是否拒

第七章 方差分析

第七章方差分析 方差分析(analysis of variance)是检验多个总体均值是否相等的统计方法。目的:通过检验多个总体的均值是否相等来判断定类变量对定距变量是否有显著影响。 第一节方差分析引述 一、方差分析的基本思想和原理 例1:想了解四个行业的服务质量如何,得到以下数据: 消费者对四个行业的投诉次数 自变量行业是分类变量,因变量被投诉次数是定距变量。 想知道行业对被投诉次数的影响,就要分析不同行业的被投诉次数之间是否有显著差异,即检验四个行业被投诉次数的总体均值是否相等(注意不是样本均值)。如果相等,行业对投诉次数无影响;如果均值不全相等,有影响。 为什么不用均值检验的方法? 均值检验一次只研究两个样本,要检验4个总体均值是否相等,需要6次检验(1-2,1-3,1-4,2-3,2-4,3-4)。每次检验犯第一类错误的概率是α,作多次检验会增加犯错概率和降低置信水平。而方差分析同时将所有样本信息结合在一起,增加了分析的可靠性,降低了犯错的概率,避免拒绝真实的原假设。如何用样本均值检验总体均值即判断行业对投诉次数是否有影响? 各行业被投诉次数的样本均值不相等,是否可说明不同行业被投诉次数有明显差异?不一定,也许各行业总体均值无差异,仅仅因为抽样的随机性造成了彼此之间的差异/随机误差。(来自同一个总体的各个样本之间因为随机性而造成的均值差异和来自不同总体的样本之间的均值差异在散点图上是有差异的。)所以,方差分析就是对于差异来源进行分析(来源于随机误差还是不同总体间的真实差异),从而判断不同总体均值是否相等。 在例1中,在同一行业(同一总体)下,样本的各观测值不同,其差异可看作抽样的随机性造成的,称之为随机误差。在不同行业(不同总体)下,各观测

第七章 方差分析基础

第七章方差分析基础 &7.1 方差分析的必要性与作用 一、方差分析的必要性 ●前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理的优劣。用于 多个平均数间差异显著性测验,就会表现出如下一些问题: 1.多个处理用t测验计算麻烦 若进行5个样本平均数的差异显著性比较,则需进行10次两两均数差异显著性测验: H0: μ1= μ2 , μ1= μ3 , μ1= μ4 , μ1= μ5; μ2= μ3 , μ2= μ4 , μ2= μ5; μ3= μ4 , μ3= μ5; μ4= μ5 . 因此, 当样本平均数的个数k≥3时,采用上章学习的方法进行差异显著性测验,工作量是相当大的。 2.推断的可靠性降低,犯α错误的概率增大 t测验,α=0.05时犯第一类错误的概率为0.05, 推断的可靠性为1- α =0.95。 5个处理采用t测验进行比较,α=0.05, 需进行10次两两比较,每次比较的可靠性为1- α =0.95 , 10次推断的可靠性由0.95降到0.5987, 犯第一类错误的概率则由0.05上升0.4013. 3.误差估计的精确性和检验的灵敏性降低 采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。 因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用——方差分析法。 二、方差分析的作用 ●解决多个处理的比较问题,充分利用资料的全部信息,提高分析的精确度。 1、在单因素试验中,可以分辨出最优的水平。 2、在多因素试验中,可以分辨出最优的水平组合。 &7.2 方差分析及基本原理 方差分析的概念: 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对重要性的一种统计方法。 一、数据结构与变异来源的分解 设有k个处理,每个处理有n个观察值,则共有nk个观察值,其数据结构和符号如表7.1。

第七章 方差分析

第七章方差分析 第一节方差分析的意义 ?3个以上平均数间的差异进行显著性检验,若仍采用t检验法两两检验,将存在以下三方面的缺陷:?其一,检验过程非常烦琐。 ?其二,不能充分利用试验资料的全部信息,精度不高。 ?其三,随着k的增大,犯第一类错误的概率也将增加。 第二节方差分析的步骤 ?一、自由度和平方和的分解 ?方差是平方和除以自由度的商。因此,方差分析的第一步就是进行自由度和平方和的分解。?设有k个处理,每个处理皆含有n个重复观察值的完全随机试验资料,其数据结构见表7.1。 表7.1 k个处理每处理n个重复观察值的完全随机试验数据符号表 表7.1 nk个观察值的单向分组资料模式 ?总变异平方和 ?总变异是nk个观察值的变异, ?受条件的限制,自由度为n T=nk-1 ?总变异平方和可以分解为处理内和处理间两个部分 ?处理内(即误差)变异为各处理内观察值与处理平均数的变异,因每处理具有自由度(n– 1)和平方和 ?而资料共有k个处理,故处理内自由度为: ?df e=k(n– 1) ?处理内平方和SS e为: ?处理平均数间的平方和 ?具自由度n t=k-1,注意 ?为了正确地进行F测验,必须使它们都估计着同一参数s2,。因而,样本间的平方和应为: 总变异的=处理间的+处理内的 平方和 SS T = SS t + SS e 自由度 (nk-1) = (k-1) + k(n-1) 进而得: 样本间的均方 样本内的均方 ?〔例7.1〕研究A、B、C、D、E共5个饲草品种的鲜草产量差异,E为对照,盆栽试验,每品种3盆,完全随机放置于同一网室内。以对照E孕穗期作为刈割日期,测得各品种单株鲜重(g)见表7.2,试分解其自由度和平方和。 表7.2 不同饲草品种单株鲜重的结果(g) ?解: ?总变异自由度df T=nk-1=3?5-1=14 ?处理(品种)间自由度df t=k-1=5-1=4 ?品种内(误差)自由度df e=k(n-1)=5?(3-1)=10 ?矫正数

相关文档
最新文档