方差分析简介

合集下载

方差分析的概念与应用

方差分析的概念与应用

方差分析的概念与应用方差分析(Analysis of Variance, ANOVA)是一种统计方法,用于比较三个或三个以上样本均值是否存在显著差异。

其基本原理是通过将总方差分解为不同来源的方差,从而判断不同组之间是否存在显著性差异。

方差分析在生物医学、心理学、市场营销等多个领域都得到了广泛的应用。

本文将详细探讨方差分析的基本概念、方法及其实际应用。

一、方差分析的基本概念1.1 什么是方差方差是指数据集中各数据值与其均值之间的离散程度,它衡量了数据分布的变动幅度。

方差越大,数据分布越分散;相反,方差越小,数据分布越集中。

在方差分析中,我们主要关注的是不同样本均值之间的方差。

1.2 方差分析的原理在进行方差分析时,我们首先计算总体样本的总方差。

这一总方差可以分解为组间方差和组内方差。

具体来说:组间方差:代表不同组均值之间的变异程度。

组内方差:代表同一组内部样本之间的变异程度。

根据F检验原理,当组间方差显著大于组内方差时,可以认为至少有一个组的均值与其他组存在显著性差异。

这一过程可以用F统计量来表示,F统计量等于组间平均平方(Mean Square Between)除以组内平均平方(Mean Square Within)。

二、方差分析的类型2.1 单因素方差分析单因素方差分析是最基础的方差分析方法,适用于仅有一个因素对结果变量影响的情况。

例如,研究不同肥料对植物生长高度的影响,我们可以采用单因素方差分析。

在进行单因素分析时,假设我们有n个样本,每个样本在不同处理下进行观察。

通过计算各处理组均值与全局均值的偏离程度,可以判断是否有显著性差异。

2.2 双因素方差分析双因素方差分析则扩展至两个自变量对因变量影响的情况。

例如,研究不同肥料和不同光照条件下植物生长高度的影响。

在这种情况下,不仅要考虑肥料对植物生长高度的影响,还需要考虑光照对植物生长高度以及两者交互作用。

双因素分析可以帮助研究者揭示更复杂的关系,从而提供更加深入的理解。

方差分析

方差分析

• 3.2 固定效应模型 • 3.2.1 线性统计模型 • 在固定效应模型中, α i 是处理平均数与总平均数 的离差,是个常量,因而 • ∑α i=0 I=1,2,…,n (3.2) • 要检验 α 个处理效应的相等性,就要判断各 α i 是否都 等于 0 。若各 α i 都等于 0 ,则各处理效应之间无差异。 因此,零假设为: • HO: α 1=α 2=...=α α =0 • 备择假设为: • HA: α i≠0(至少有1个i) • 若接受H0,则不存在处理效应,每个观测值都是由总平 均数加上随机误差所构成。若拒绝H0,则存在处理效应, 每个观测值是由总平均数、处理效应及误差三部分构成 的。
自由度可以做同样的分割:自由度 dfT=an-1;A因素共有a水平,因而 dfA=a-l;误差项有 α n-α 自由度,这是因为每一处理均有n - 1 自由度,共有 α 个处理,因而 dfe=α n-α 。为了估计 σ 2, 用 SSe除以相应的自由度 MSe=SSe/(an-a) (3.8) MSe称为误差均方(error mean sqare)。记MSA为处理均方, MSA=SSA/(α -1) (3.9) 3. 2. 3 均方期望与统计量F 可以由MSe的数学期望证明MSe是σ 2的无编估计量。误差均方反映 了随机因素所造成的方差的大小,它是σ 2的无偏估计量。对于处理 项来说,只有当零假设 HO:α 1=α 2= …=α i=0 成立时, MSa 才是 σ 2 的无偏估计量。当α i=0时,n/(α -1)∑α i2项等于 0,这时 E(MSA) =σ 2 ,因此用 MSA与MSe比较,就可以反映出α i的大小。若 MSA与 MSe相差不大,就可以认为各α i与 0的差异不大,或者说各处理平 均数(μ i)间差异不大。若 MSA比MSe超出很多,则认为μ i间差异 是显著的。为此,用 F上尾单侧检验。 F=MSA/MSe, (3.10) Fα ,(dfA,dfe)

方差分析简介

方差分析简介

方差分析简介(一)方差分析是我们从心理统计这门课就提到一个基本的统计方法。

但或许很多人到做研究生毕业论文的时候,还没搞清楚到底方差分析是怎么一回事。

我们的老师对很多基本的地方也是含糊不清。

我就我几年学习和应用的理解,粗略讲一下方差分析是怎么回事。

什么是方差分析?就是对方差的分析。

有人说你这不废话么?这还真不是废话。

t检验就不是对方差的分析。

独立样本t检验是对两个样本均值的差异进行检验,而相关样本t检验是对两个样本差异的均值进行检验。

而方差分析就是对引起样本数据出现差异的若干因素影响孰强孰弱的分析。

换句话说,当样本数据差异较小的时候,t检验会认为不存在差异,但方差分析可以从这较小的差异中分析出实验处理和随机误差谁对这个差异贡献更大。

所以说在控制水平一定的情况下,方差分析更容易得到显著性水平高,但power较低的结果。

(因为虽然差异贡献大,但本身差异不大。

翻译为人话就是这个研究结果虽然显著但没什么意义。

)既然是对方差的分析,那么研究者对数据就有一定的要求。

不是什么样的数据都适合做方差分析。

这其中最重要最重要的,违反了就无从可谈的就是至少要等距数据(interval data)。

因为至少等距数据才能做参数检验。

称名数据(nominal data)和顺序数据(ordinal data)只能做非参数检验。

既然要分析方差,就得有均值,有方差。

第二重要的是要正态分布的数据。

为什么要强调数据正态分布呢?这要从平均数说起,平均数,从定义上来说,是一组数据中唯一对其离均差之和为0的数值。

如果数据呈正态分布,平均数就是一组数据中最具有代表性的那个值。

好比说一次考试全班的平均分为81.6分,我们大概可以知道有两个事实:1)多数同学考试分数是七八十分,2)如果你高于82分说明你考的还算不错,低于81分就说明考得不够理想。

这个高低差距越大,这个结论的信心就越强。

这两个结论是基于考试分数是基本上的正态分布推断出来的。

如果不是正态分布怎么样呢?拿工资说话,以我所在的圣安东尼奥市为例,这个城市适合工作年龄的人,大约有55%的“蓝领”,30%的“白领”,14%学生或自由职业者,和1%的绝对高收入者。

t检验、u检验、卡方检验、F检验、方差分析

t检验、u检验、卡方检验、F检验、方差分析

记录中常常会用到多种检查,如何懂得何时用什么检查呢,根据结合自己旳工作来说一说:t检查有单样本t检查,配对t检查和两样本t检查。

ﻫﻫ单样本t检查:是用样本均数代表旳未知总体均数和已知总体均数进行比较,来观测此组样本与总体旳差别性。

配对t检查:是采用配对设计措施观测如下几种情形,1,两个同质受试对象分别接受两种不同旳解决;2,同一受试对象接受两种不同旳解决;3,同一受试对象解决前后。

u检查:t检查和就是记录量为t,u旳假设检查,两者均是常见旳假设检查措施。

当样本含量n较大时,样本均数符合正态分布,故可用u 检查进行分析。

当样本含量n小时,若观测值x符合正态分布,则用t检查(因此时样本均数符合t分布),当x为未知分布时应采用秩和检查。

ﻫF检查又叫方差齐性检查。

在两样本t检查中要用到F检查。

ﻫ从两研究总体中随机抽取样本,要对这两个样本进行比较旳时候,一方面要判断两总体方差与否相似,即方差齐性。

若两总体方差相等,则直接用t检查,若不等,可采用t'检查或变量变换或秩和检查等措施。

其中要判断两总体方差与否相等,就可以用F检查。

简朴旳说就是检查两个样本旳方差与否有明显性差别这是选择何种T检查(等方差双样本检查,异方差双样本检查)旳前提条件。

在t检查中,如果是比较不小于不不小于之类旳就用单侧检查,等于之类旳问题就用双侧检查。

卡方检查是对两个或两个以上率(构成比)进行比较旳记录措施,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检查。

方差分析用方差分析比较多种样本均数,可有效地控制第一类错误。

方差分析(analysis of variance,ANOVA)由英国记录学家R.A.Fisher一方面提出,以F命名其记录量,故方差分析又称F检查。

其目旳是推断两组或多组资料旳总体均数与否相似,检查两个或多种样本均数旳差别与否有记录学意义。

我们要学习旳重要内容涉及单因素方差分析即完全随机设计或成组设计旳方差分析(one-way ANOVA):用途:用于完全随机设计旳多种样本均数间旳比较,其记录推断是推断各样本所代表旳各总体均数与否相等。

方差分析简介

方差分析简介

方差分析简介1. 引言方差分析(analysis of variance,简称ANOV A)是一种假设检验方法,即基本思想可概述为:把全部数据的总方差分解成几部分,每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应,将各部分方差与随机误差的方差相比较,依据F分布作出统计推断,从而确定各因素或交互作用的效应是否显著。

因为分析是通过计算方差的估计值进行的,所以称为方差分析。

方差分析的主要目标是检验均值间的差别是否在统计意义上显著。

如果只比较两个均值,事实上方差分析的结果和t检验完全相同。

只所以很多情况下采用方差分析,是因为它具有如下两个优点:(1)方差分析可以在一次分析中同时考察多个因素的显著性,比t检验所需的观测值少;(2)方差分析可以考察多个因素的交互作用。

方差分析的缺点是条件有些苛刻,需要满足如下条件:(1)各样本是相互独立的;(2)各样本数据来自正态总体(正态性:normality);(3)各处理组总体方差相等(方差齐性:homogeneity of variance)。

因此在作方差分析之前,要作正态性检验和方差齐性检验,如不满足上述要求,可考虑作变量变换。

常用的变量变换方法有平方根变换,平方根反正弦变换、对数变换及倒数变换等。

方差分析在医药、制造业、农业等领域有重要应用,多用于试验优化和效果分析中。

2. 单因素方差分析2.1 基本概念(1)试验指标:在一项试验中,用来衡量试验效果的特征量称为试验指标,有时简称指标,也称试验结果,通常用y表示。

它类似于数学中的因变量或目标函数。

试验指标用数量表示称为定量指标,如速度、温度、压力、重量、尺寸、寿命、硬度、强度、产量和成本等。

不能直接用数量表示的指标称为定性指标。

如颜色,人的性别等。

定性指标也可以转化为定量指标,方法是用不同的数表示不同的指标值。

(2)试验因素:试验中,凡对试验指标可能产生影响的原因都称为因素(factor),也称因子或元,类似于数学中的自变量。

anova方差分析

anova方差分析

anova方差分析ANOVA(Analysis of Variance)是一种常用的统计方法,用于比较多个样本之间的平均值是否存在差异。

通过方差分析,我们可以判断多个样本的平均值是否具有统计学上的显著差异,以及这种差异是由于不同样本之间的差异,还是由于随机因素引起的。

本文将介绍ANOVA方差分析的基本原理、应用场景,以及实施方差分析的步骤和注意事项。

一、ANOVA方差分析的基本原理ANOVA方差分析的基本原理是通过对总体方差的分解来判断多个样本之间的平均值是否存在差异。

具体而言,方差分析假设总体的均值相等,然后通过计算组内方差和组间方差来辅助判断样本的均值是否存在显著差异。

二、ANOVA方差分析的应用场景ANOVA方差分析适用于多个样本之间的比较,例如:1.医学研究中比较不同治疗方法的疗效;2.市场调研中比较不同广告宣传方式的效果;3.教育研究中比较不同教学方法的有效性。

三、ANOVA方差分析的步骤进行ANOVA方差分析通常需要以下几个步骤:1.确定研究问题和目标:明确研究问题,确定需要比较的组别;2.收集数据:针对每个组别收集样本数据;3.计算方差:计算组内方差和组间方差;4.计算统计量:根据计算的方差,计算ANOVA F值;5.进行假设检验:比较计算得到的F值与临界值,进行假设检验;6.进行事后比较(可选):如果拒绝了原假设,可以进行事后比较来确定具体哪些样本均值存在显著差异。

四、ANOVA方差分析的注意事项在进行ANOVA方差分析时,需要注意以下几点:1.样本数据的独立性:不同样本之间应当是相互独立的;2.数据正态性的检验:需要对数据进行正态性检验,确保数据符合正态分布;3.方差齐性的检验:需要对数据进行方差齐性的检验,确保各组别的方差相等;4.选择适当的方差分析方法:根据实际研究问题和数据的特点,选择适当的方差分析方法。

总结:ANOVA方差分析是一种重要的统计分析方法,可用于比较多个样本之间的平均值是否存在差异。

Minitab单因素方差分析


收集数据
首先需要收集用于单因素 方差分析的数据,确保数 据具有代表性且样本量足 够。
数据整理
将收集到的数据整理成表 格形式,便于后续分析。
数据检验
在进行分析前,需要对数 据进行检验,确保数据满 足方差分析的前提假设, 如正态性、方差齐性等。
Minitab操作过程
01
打开Minitab软件,输入数据。
等。
02
讨论结果
根据解读结果,对不同组之间的差异进行讨论,并给出合理的解释。
03
结论
根据分析结果得出结论,并给出相应的建议或措施。
05
注意事项与局限性
注意事项
确保数据满足方差分析的前提假设
单因素方差分析的前提假设包括独立性、正态性、方差齐性和误差项的随机性。在进行分 析之前,应检查数据是否满足这些假设。
对异常值敏感
单因素方差分析对异常值较为敏感,异常值的存在可能会对分析结 果产生较大影响。
无法处理非参数数据
单因素方差分析适用于参数数据,对于非参数数据,如等级数据或 有序分类数据,分析效果可能不佳。
未来研究方向
发展非参数方差分析方法
针对非参数数据和非正态分布数据的方差分析方法研究是 未来的一个重要方向。
感谢观看
THANKS
方差齐性检验的方法包括Bartlett检验 和Levene检验等。
数据的正态性检验
判断数据是否符合正态分布,如果不 符合则需要进行数据转换或采用其他 统计方法。
正态性检验的方法包括Shapiro-Wilk 检验、Kolmogorov-Smirnov检验等 。
数据的方差分析
01
计算各组数据的平均值、方差等统计量。
03
通过Minitab,用户可以方便地导入数据、设置分析 参数、查看分析结果和制作统计图形。

方差分析的概念与应用

方差分析的概念与应用方差分析(AnalysisofVariance,ANOVA)是统计学中一种重要的数据分析方法,可以用于比较三个或三个以上的平均值之间是否存在显著差异。

它被广泛应用于各个领域,包括医学、社会科学、市场研究等,以解决具有多个因素的数据问题。

本文将介绍方差分析的概念、原理和应用,帮助读者更好地理解和应用这一统计学方法。

什么是方差分析?方差分析是一种统计方法,旨在比较不同组之间的平均数是否存在显著差异。

它基于一个重要的假设:样本之间的差异是由于组内误差和组间误差所引起的。

组内误差是指同一组内个体之间的变异,而组间误差则是指不同组之间的差异。

通过对这两种误差进行比较,我们可以确定组间平均值是否有统计学上的显著差异。

方差分析的本质在于将总的方差分解为组间方差和组内方差,并通过计算统计量F来判断组间方差是否显著大于组内方差。

如果F值大于一定的临界值,则可以拒绝原假设,即认为组间差异较大,存在显著差异。

方差分析的应用场景方差分析可以广泛应用于各种实际问题的解决中,下面我们将介绍几个常见的应用场景。

医学研究在医学研究中,方差分析可以用于比较不同药物或治疗方法在不同组患者中的疗效差异。

以某种疾病的治疗为例,可以将患者随机分为不同的治疗组,然后比较各组的平均治愈时间或治愈率是否存在显著差异。

通过方差分析,可以获得客观而可靠的结果,为治疗方案的制定提供科学依据。

市场研究在市场研究中,方差分析可以用于比较不同产品或广告策略在不同群体中的效果差异。

例如,某家公司想要推出一款新产品,可以将潜在用户随机分为不同受众群体,然后通过方差分析来确定不同产品特性对用户满意度的影响程度,以指导后续的产品改进和市场推广策略。

社会科学研究在社会科学研究中,方差分析可以用于比较不同群体在某种社会现象上的差异。

例如,某项研究想要了解不同年龄段人群对待待人接物的态度差异,可以将人群按年龄分组,然后通过方差分析来确定不同年龄段之间是否存在显著差异。

方差分析简介


(3) 其它说明

独立性的假设条件一般可以通过对数据搜集 过程的控制来保证。 如果确实严重偏离了前两个假设条件,则需 要先对数据进行数学变换,也可以使用非参 数的方法来比较各组的均值。

方差分析的实质
1.
2.
在上述假定条件下,判断颜色对销售量是否有显著影 响,实际上也就是检验具有同方差的四个正态总体的 均值是否相等的问题 如果四个总体的均值相等,可以期望四个样本的均值 也会很接近
… … : : …
x1k x2k : : xnk
方差分析的步骤
1.提出零假设和备择假设:

零假设:各总体的均值之间没有显著差异,即
H0 : 1 2 r

备择假设:至少有两个均值不相等,即
H1 : 1, 2 ,, r不全相等
28

2.根据样本计算F统计量的值。 方差分析表
组间均方差
组内均方差
SSA MSA r 1
SSE MSE nr
32
方差分析的基本思想
组间均方差 MSA
SSA r 1
F=

SSE 组内均方差 MSE nr
F 服从自由度为(r-1, n-r)的 F 分布。
33

3. 对比 p值与α ,结合原假设作出推断。如果 p< α ,则拒绝原假设,不同因素水平下观测变量各 总体均值存在显著差异。 在零假设成立时组间均方差与组内均方差的比值 服从服从自由度为(r-1, n-r) 的 F 分布
N
1 2 3 4 6 6 6 6
均值
3433 3450 2733 2400
标准差
378 596 505 420
在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的, 因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进 行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得 多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体 平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不 齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果可能 有一部分归因于各个实验组内总体方差不同所致。 Levene方差齐性检验也称为Levene检验(Levene‘s Test).由H.Levene在 1960年提出。 Levene检验主要用于检验两个或两个以上样本间的方差 是否齐性, 要求样本为随机样本且相互独立。

方差分析

变异来源 总 变 异 组间变异 组内变异 离均差平方和 SST SSA SSE 自由度 DFT DFA DFE
k SSE (n 1) Si 2 i 1
均 方 MST MSA MSE F P
本文Minitab仅供课程讲解使用,如有需求请支持正版
P20
方差分析
方差分析的基本思想是: 通过分析两种不同来源的变异对总变异的贡献大小, 从而确定可控因素对研究结果影响的大小(显着性)。
要解决的问题 – 检定 k 个母体(k个处理)的平均数是否存在差异 – 即检定大母体的变异大小,越集中代表越相似,越 分散代表越不一样
本文Minitab仅供课程讲解使用,如有需求请支持正版
P14
假设检验
样本
μ 平均值 单样本 Z (σ已知) 单样本 t (σ未知)
双样本 ( σ 12= σ 2 2 ) 配对 (成队检验) 方差分析 F-test ( σ 12= σ 2 2 = σ i 2 )
P3
方差分析理论基础
本文Minitab仅供课程讲解使用,如有需求请支持正版
P4
请大家思考一些问题:
1、如果有6个总体平均值比较,是否可以通过两两 进行假设检验得出? 2、如果把样本平均数两两比较一共有多少对?
C62=15对
3、每对都以0.95的置信度得出均值相等的结论,但 由此得出这6个总体均值都相等,这一结论的置信 度是多少?
Percent
70 60 50 40 30 20 10 5
1
9.92
9.94
9.96
9.98 C 机床
10.075
10.00
10.02
10.04
1
9.950
D 机床 本文Minitab 仅供课程讲解使用,如有需求请支持正版
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

方差分析简介1. 引言方差分析(analysis of variance,简称ANOV A)是一种假设检验方法,即基本思想可概述为:把全部数据的总方差分解成几部分,每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应,将各部分方差与随机误差的方差相比较,依据F分布作出统计推断,从而确定各因素或交互作用的效应是否显著。

因为分析是通过计算方差的估计值进行的,所以称为方差分析。

方差分析的主要目标是检验均值间的差别是否在统计意义上显著。

如果只比较两个均值,事实上方差分析的结果和t检验完全相同。

只所以很多情况下采用方差分析,是因为它具有如下两个优点:(1)方差分析可以在一次分析中同时考察多个因素的显著性,比t检验所需的观测值少;(2)方差分析可以考察多个因素的交互作用。

方差分析的缺点是条件有些苛刻,需要满足如下条件:(1)各样本是相互独立的;(2)各样本数据来自正态总体(正态性:normality);(3)各处理组总体方差相等(方差齐性:homogeneity of variance)。

因此在作方差分析之前,要作正态性检验和方差齐性检验,如不满足上述要求,可考虑作变量变换。

常用的变量变换方法有平方根变换,平方根反正弦变换、对数变换及倒数变换等。

方差分析在医药、制造业、农业等领域有重要应用,多用于试验优化和效果分析中。

2. 单因素方差分析2.1 基本概念(1)试验指标:在一项试验中,用来衡量试验效果的特征量称为试验指标,有时简称指标,也称试验结果,通常用y表示。

它类似于数学中的因变量或目标函数。

试验指标用数量表示称为定量指标,如速度、温度、压力、重量、尺寸、寿命、硬度、强度、产量和成本等。

不能直接用数量表示的指标称为定性指标。

如颜色,人的性别等。

定性指标也可以转化为定量指标,方法是用不同的数表示不同的指标值。

(2)试验因素:试验中,凡对试验指标可能产生影响的原因都称为因素(factor),也称因子或元,类似于数学中的自变量。

需要在试验中考察研究的因素,称为试验因素,有时也称为因素,通常用大写字母A、B、C、……表示。

在试验中,有些因素能严格控制,称为可控因素;有些因素难以控制,称为不可控因素。

试验因素是试验中的已知条件,能严格控制,所以是可控因素。

通常把未被选作试验因素的可控因素和不可控因素都称为条件因素,统称为试验条件。

(3)因素水平:因素在试验中所处的各种状态或所取的不同值,称为该因素的水平(level),也简称为水平或位级,通常用下标1、2、3、……表示。

若一个因素取K种状态或K个值,就称该因素为K水平因素。

因素的水平,有的可以取得具体值,如6Kg、10cm;有的只能取大致范围或某个模糊概念,如软、硬、大、小、好、较好等;但也有无法用数值表征的,如履带的不同形式,轮胎花纹的不同种类,机器的不同操作方式,大豆的不同品种等。

(4) 处理组:所有试验因素的水平组合所形成的试验点称为处理组(treatment group),也称组合处理。

三因素试验中,A 1B 2C 3是一个组合处理,它表示由A 因素1水平、B 因素2水平和C 因素3水平组合而形成的一个试验点。

2.2 主要步骤假设我们在实验中只考虑因素A ,该因素有p 个水平,每个水平做r 次重复试验,设第i 个水平的第j 次重复试验的数据为ij y ,如表1所示。

表1 试验数据1A 2A … i A … p A 1 11y 21y … 1i y … 1p y 2 12y22y… 2i y… 2p y… ……… …… …j 1j y2j y… ij y… pj y… ……… …… …r 1r y 2r y …ir y …pr y根据这些数据,可以计算全体数据的均值y 和和各水平对应数据的均值.i y :111p r ij i j y y rp ===∑∑,.11ri ij j y y r ==∑,i=1, 2, …, p进一步,可以计算全体数据的偏差平方和T S 、因素A 对应的偏差平方和A S ,以及误差的偏差平方和e S :211()prT ij i j S y y ===-∑∑2.1()pA i i S r y y ==-∑2.11()pre ij i i j S y y ===-∑∑下一步,需要计算这三个偏差平方和所对应的自由度。

之所以要计算自由度,是因为如果用偏差平方和除以对应的数据项数,得到的统计量并不是方差的无偏估计。

而偏差平方和与对应的自由度的商才是方差的无偏估计。

设有n 个数据x 1, x 2, …, x n ,它们的平方和21n ii S x==∑的自由度取决于{x i }之间有多少个线性约束关系。

设X=(x 1, x 2, …, x n )T ,若存在秩为m 的矩阵A ,满足0AX =则S 的自由度是n-m 。

下面来求S T 的自由度。

令k ij x y y =-,1,2,...,i p =,1,2,...,j r =,(1)k i r j =-+,则{x i }之间存在一个线性约束11111()0rppprri ijij i i j i j x yy y rpy ======-=-=∑∑∑∑∑即m=1,A=(1, 1, …, 1),故1T f rp =-。

同理可得1A f p =-,e f rp p =-。

可以证明(证明本文从略),对于偏差平方和与其对应的自由度,如下关系成立:T A e S S S =+,T A e f f f =+这就是Fisher 偏差平方和加性原理,它是全部方差分析的基础。

在得到偏差平方和及其对应的自由度后,就可以得到因素A 和误差e 对应的平均偏差平方和/A A A S S f =,/e e e S S f =平均偏差平方和是反映数据波动大小的一个测度,比较A S 和e S 的大小可以看出因素A 的不同水平带来的试验指标的波动是否与随机误差相同,所以,可以由此判断因素A 对试验指标是否有显著影响。

判断A S 和e S 是否相同的方法采用F 检验(基于F 分布的假设检验),令/A e F S S =则可认为F 服从自由度为A f 和e f 的F 分布。

用求出的F 值查F 分布表可得到对应的P 值,一般取置信水平α=0.05,即当P 值小于0.05时拒绝原假设,认为因素A 对试验指标的影响显著,否则维持原假设,认为影响不显著。

2.3 数学模型设因素A 取了p 个水平,每个水平重复了r 次试验,在水平A i 下的第i 次实验结果y ij可以分解为ij i ij y με=+其中,i μ表示在水平Ai 下的理论指标值,ij ε是试验误差。

我们把试验误差ij ε认为是相互独立的随机变量,且服从正态分布2(0,)N σ,这是方差的基本假设之一。

为了看出因素各水平的影响大小,将i μ再进行分解,令11pi i p μμ==∑i i a μμ=-,i=1, 2, …, p则ij i ij y a με=++,i=1, 2, …, p; j=1, 2, …, r显然{a i }之间有关系10pii a==∑a i 表示水平A i 对试验结果产生的影响,它称作水平A i 的效应。

方差分析的数学模型就是建立在这么几条假定的基础上的: (1)ij i ij y a με=++,i=1, 2, …, p; j=1, 2, …, r (2)10pi i a ==∑(3)ij ε相互独立且都服从分布2(0,)N σ 由这三条建立的模型叫做线性模型。

建立模型以后,统计分析需要解决下列问题:1. 参数估计。

即通过试验估计μ和{a i },它们的估计量用ˆμ和{ˆi a }表示。

111ˆp ri i j y y rp μ====∑∑ .11111ˆp r ri i i ij i i j ay y y y r rp ====-=-∑∑∑ 可以证明(本文从略),ˆμ和{ˆi a }是μ和{a i }的无偏估计。

2. 假设检验。

如果因素A 对指标有影响,效应{a i }不全为0,如果因素A 对指标没有影响,则效应{a i }全为0。

因此,要检验因素A 对指标影响是否显著就是检验假设012: ...0p H a a a ====这需要选择一个合适的统计量。

令.11r i ij j r εε==∑,111p rij i j rp εε===∑∑则..1111()r ri ij i ij i i j j y y a a r r μεμε====++=++∑∑111()p ri ij i j y a n μεμε===++=+∑∑故22..1122..111()()2()()p pA i i i i i p p pi i i i i i i S r y y r a r a r a r εεεεεε======-=+-=+-+-∑∑∑∑∑22..1111()()p p rre iji i i j i j S yy εε=====-=-∑∑∑∑如果原假设H 0成立,则12...0p a a a ====,有2.1()pA i i S r εε==-∑因为ij ε相互独立且都服从分布2(0,)N σ,由统计理论推知2A S σ服从自由度为(1)A f p =-的2χ分布,2e S σ服从自由度为()e f n p =-的2χ分布,而且两者独立,从而A A Ae e eS S f F S S f ==服从自由度为A f ,e f 的F 分布。

所以可以采用F 统计量作为假设检验的统计量(这种假设检验称为F 检验),通过查F 分布表确定拒绝域或P 值,从而作出推断结论。

3. 多因素方差分析所谓多因素方差分析,就是同时检验多个因素影响是否显著的方差分析方法。

多因素方差分析。

方差分析的一大优势就是可以同时考虑多个试验因素对试验指标的影响,这样,既节省了试验次数,试验误差也比进行多次单因素方差分析要小。

在多因素方差分析中,有一个很重要的问题,就是试验设计(DOE: Design of Experiment)。

其主要目的是通过设计每次试验中因素水平的搭配,用尽可能少的试验次数和试验数据满足方差分析的要求,获得较好的分析结果。

最常用的试验设计有析因设计和正交设计。

前者是对所有因素的所有水平组合都进行试验,因此又称交叉分组设计;后者是按照某种正交表设计试验,以较少的试验次数即可接近析因设计的效果。

因此,析因设计一般用于两个因素且水平数较少的情况,而因素和水平较多时则多采用正交设计。

除正交设计外,还有其它许多实验设计方法,如系统分组设计(嵌套设计)、正交拉丁方设计、裂区设计等,它们一般用在并非任意组合都可以实现或找不到合适的正交表的情况。

实验设计确定的一个水平组合,如A 1B 2A 3,称作一个处理组。

如果在一个处理组内做多次重复试验得到多个试验数据,则称为有重复试验的设计,否则称无重复试验的设计。

相关文档
最新文档