第六章 方差分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

方差分析原理
数据观察值之间的差异来自两个方面: 数据观察值之间的差异来自两个方面:
一方面:相同颜色在不同超市销量不同,此为随机 一方面:相同颜色在不同超市销量不同, 性差异(产生水平内部方差) 性差异(产生水平内部方差) 另一方面:颜色不同,销路不同, 另一方面:颜色不同,销路不同,是由于随机因素 和系统性差异造成(产生水平之间的方差) 和系统性差异造成(产生水平之间的方差)
– 检验行因素的统计量 MSR FR = ~ F(k 1, (k 1)(r 1)) MSE – 检验列因素的统计量 MSC FC = ~ F(r 1, (k 1)(r 1)) MSE
– 对列因素提出的假设为
分析步骤
(构造检验的统计量)
计算平方和(SS)
– 总误差平方和 – 行因素误差平方和 – 列因素误差平方和 – 随机误差项平方和
SST = ∑∑(xij x )
k r i=1 j =1
k r
2
SSR = ∑∑(xi. x )
i=1 j =1 k r
2
SSC = ∑∑(x. j x )
第五步:均值的F检验
H 0 : 1 = 2 = 3 = 4
H1 : 1 , 2 , 3 , 4不全相等
显著性水平0.05下,
Fα (r 1, n r ) = F0.05 (3,16) = 3.24
结论:因为F=10.486>3.24,所以拒绝原 假设,颜色对销量有显著影响。
英语教师欲了解自己所教 个不同专业 英语教师欲了解自己所教3个不同专业 学生的英语成绩是否与他们所属的专业 有关,分别从统计、会计、金融3个不 有关,分别从统计、会计、金融 个不 同专业中各随机抽取4名 同专业中各随机抽取 名,将他们的成 绩整理列于下表。假定这3个不同专业 绩整理列于下表。假定这 个不同专业 学生在其他各方面条件基本相同。 学生在其他各方面条件基本相同。 试检验不同专业学生的英语成绩有无显 著差异。 显著性水平为0.05 ) 著差异。( 显著性水平为
i=1 j =1 k r
2
SSE = ∑∑(xij xi. x. j + x )
i=1 j=1
2
分析Fra Baidu bibliotek骤
(构造检验的统计量)
总离差平方和(SST )、水平项离差平方和 (SSR和SSC) 、误差项离差平方和(SSE) 之间 的关系
∑∑(x
k r i=1 j =1 k r i=1 j =1
ij
x)
nj
总均值 x =
∑ ∑ xij
n
超市 1 2 3 4 5 合计 水平均值 个数 总均值
无色 粉色 26.5 31.2 28.7 28.3 25.1 30.8 29.1 27.9 27.2 29.6 136.6 147.8 27.32 29.56 5 5 28.695
橘黄色 27.9 25.1 28.5 24.2 26.5 132.2 26.44 5
(反映水平之间)
SST=SSE+SSA
第三步:计算方差(离差平方和/自由度)
– SST的自由度为n-1 – SSA的自由度为r-1 – SSE SSE的自由度为n-r n-r
方差为:MSA=SSA/(r-1) MSE=SSE/(n-r) 第四步:计算F值
MSA F= = 10.486 MSE
分析步骤
(构造检验的统计量)
计算均方(MS)
– 行因素的均方,记为MSR,计算公式为
– 列因素的均方,记为MSC ,计算公式为
SSR MSR = k 1
– 随机误差项的均方,记为MSE ,计算公式为 SSE MSE = (k 1)(r 1)
SSC MSC = r 1
分析步骤
(构造检验的统计量)
计算检验统计量(F)
饮料在五家超市的销售情况
超市 1 2 3 4 5 无色 26.5 28.7 25.1 29.1 27.2 粉色 31.2 28.3 30.8 27.9 29.6 橘黄色 绿色 27.9 25.1 28.5 24.2 26.5 30.8 29.6 32.4 31.7 32.8
表中,20个数据各不相同。原因有: 表中, 个数据各不相同 原因有: 个数据各不相同。
专业 甲 统计 金融 会计 62 52 51 乙 78 58 63
英语成绩 丙 91 69 59 丁 89 75 75
双因素方差分析
(例题分析)
【 例 】 有 4 个品牌的彩电在 5 个地区销售 , 为分析彩电的品 个品牌的彩电在5 个地区销售, 品牌因素)和销售地区(地区因素)对销售量是否有影响, 牌(品牌因素 )和销售地区(地区因素)对销售量是否有影响 , 对每种品牌在各地区的销售量取得以下数据。 对每种品牌在各地区的销售量取得以下数据。试分析品牌和 销售地区对彩电的销售量是否有显著影响? 05) 销售地区对彩电的销售量是否有显著影响?(α=0.05)
1、销售地点的影响。即使颜色相同,在不同 、销售地点的影响。即使颜色相同, 的超市销量也不同。 的超市销量也不同。但是由于五个超市地 理位置等相似, 理位置等相似,因此把不同地点产品的销 量的差异看成是随机因素的影响。 量的差异看成是随机因素的影响。 2、颜色不同,销量不同。这种不同,有可能 、颜色不同,销量不同。这种不同, 是抽样随机性造成, 是抽样随机性造成,也有可能由于人们对 不同颜色有所偏爱。 不同颜色有所偏爱。
第六章 方差分析(ANOVA)
1、方差分析的原理 2、单因素方差分析 3、双因素方差分析
方差分析的基本问题
例题: 某饮料生产企业研制出一种新型饮料。 某饮料生产企业研制出一种新型饮料。 饮料颜色共有四种,见表。 饮料颜色共有四种,见表。这四种饮料 营养含量、味道、价格、 营养含量、味道、价格、包装等可能影 响销售量的因素全都相同。现从地理位 响销售量的因素全都相同。现从地理位 经营规模相仿的五家超级市场上随 置、经营规模相仿的五家超级市场上随 机收集了前一期该种饮料的销售量。 机收集了前一期该种饮料的销售量。问 饮料的颜色是否对销售量产生影响。 饮料的颜色是否对销售量产生影响。
绿色 30.8 29.6 32.4 31.7 32.8 157.3 31.46 5
第二步:计算离差平方和
总离差平方和 SST = ∑ ∑ ( xij x) 2
SSE = ∑ [ ∑ ( xij x j ) 2 ] 误差项离差平方和 j i
(反映水平内部)
水平项离差平方和 SSA = ∑ ∑ ( x j x) 2
数据结构
数据结构
xi.是行因素的第i个水平下各观察值的平均值
r
∑x
xi. =
j =1
k
ij
r x. j是列因素的第j个水平下的各观察值的均值
x. j =
(i = 1,2,L, k)
∑x
i=1
ij
x是全部 kr 个样本数据的总平均值
k r
k
( j = 1,2,L, r)
∑∑x
x=
i =1 j =1
不同品牌的彩电在各地区的销售量数据
品牌因素 品牌1 品牌 品牌2 品牌 品牌3 品牌 品牌4 品牌
地区因素 地区1 地区 365 345 358 288 地区2 地区 350 368 323 280 地区3 地区 343 363 353 298 地区4 地区 340 330 343 260 地区5 地区 323 333 308 298
若不同颜色对销量没有影响,则水平内部方 若不同颜色对销量没有影响, 差与水平之间方差近似,即 组间方差=1 差与水平之间方差近似, 组内方差 若不同颜色对销量产生影响,水平之间的 若不同颜色对销量产生影响, 系统差异+随机差异) (系统差异+随机差异)就大于水平内部方 当达到某临界值, 差,即 组间方差 > 1 。当达到某临界值,就能够判 组内方差 断不同颜色之间存在显著性差异。 断不同颜色之间存在显著性差异。
2
= ∑∑(xi. x ) + ∑∑(x. j x ) + ∑∑(xij xi. x. j + x )
2 k r 2 k r i=1 j =1 i=1 j =1
SST = SSR +SSC+SSE SSC+
分析步骤
(构造检验的统计量)
计算均方(MS) – 误差平方和除以相应的自由度 – 三个平方和的自由度分别是 总离差平方和SST的自由度为 kr-1 行因素的离差平方和SSR的自由度为 k-1 列因素的离差平方和SSC的自由度为 r-1 随机误差平方和SSE的自由度为 (k-1)×(r-1) ×
方差分析中的概念
因素:一个独立变量,方差分析的研究对象。 因素:一个独立变量,方差分析的研究对象。
一般用大写字母A、 、 等表示 等表示。 一般用大写字母 、B、C等表示。
水平:因素中的内容。一般用 表示。 水平:因素中的内容。一般用r表示 表示。 单因素方差分析:只有一个因素。本例 单因素方差分析:只有一个因素。 中颜色这个因素有4个水平 个水平。 中颜色这个因素有 个水平。
F分布
F = 组间方差 为一个统计量,服从F分布。 为一个统计量,服从 分布 分布。
组内方差
特征:F为大于零的正数 特征:F为大于零的正数 F分布曲线为正偏态 分布曲线为正偏态
第二节 单因素方差分析
1、分析步骤 2、F检验
方差分析步骤
第一步:计算均值
n
水平均值 x j =
i =1
j ∑ xij
ij
kr
分析步骤
(提出假设)
提出假设
– 对行因素提出的假设为
H0: 1 = 2 = … = i = …= k (i为第i个水平的 均值) H1: i (i =1,2, … , k) 不全相等 H0: 1 = 2 = … = j = …= r (j为第j个水平的 均值) H1: j (j =1,2,…,r) 不全相等
相关文档
最新文档