第12章单因素方差分析

合集下载

单因素方差分析

单因素方差分析


第3步 (需要多重比较时)点击【Post-Hoc】从中选择一种方法,如LSD; (需要均值图时)在
【Options】 下 选 中 【Means plot】 , ( 需 要 相 关 统 计 量 时 ) 选 择 【Descriptive】 , 点 击
【Continue】回到主对话框。点击【OK】
用SPSS进行方差分析

如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影
响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分析
(Two-factor without replication)

如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种
无交互效应的双因素方差分析
• 因为我们考虑不同司机行使时间的差异,所以要对区组做假设检验。两组假设分别为:
• 1. 不同路线均值都相等

各路线均值不全相等
• 2. 区组均值都相等

H各0区1 组: 均值不全相等
112 1314 1
• 两因素方差分析表的格式与单因素方差分析的格式一致,唯一的区别是加了一行区组变差。
第三节 单因素方差分析
1. 设1为化肥品牌A下产量的均值,2为化肥品牌B下产量的均值,3为化肥品牌C下产量的 2. 提出的假设为
▪ H0 : 1 2 3 ▪ H1 : 1 , 2 , 3 不全相等 3. 计算检验统计量
4. 计算P值,作出决策
因子均方 F残差~ 均 F(k方 1,nk)
例题分析
1. 组内误差(within groups)
▪ 样本数据内部各观察值之间的差异
• 比如,同一位置下不同超市之间销售额的差异的差异

spss学习第12章

spss学习第12章
100.0 %
45.1% 18.2%
图12-10 性别和年龄条图
2. 问题二输出结果详解 一、性别因素对购买顾虑的差异性影响。 (1)方差齐性检验 SPSS的结果报告中首先列出了方差齐性检验结果表 12-6。由于这里采用的是Levene检验法,故表格首先显 示Levene统计量等于0.006。由于概率P值0.937明显大于 显著性水平,故认为不同性别下的购买顾虑值的方差是 相同的,满足方差分析的前提条件。
图12-9 年龄变量直方图
(3)列联表分析 表12-5是“性别”变量和“年龄”变量的列联表。 行变量是“年龄”变量,列变量是“性别”变量。可以 看到,总共178位男性调查者中,年龄在“20岁以下”的 共有27人,“21-30岁”的有88人,依次类推。对比行分 比、列百分比和合计百分比看到,男性中约一半的调查 者年龄都介于21-30岁之间,而对于女性调查者来说, “20岁以下”和“21-30岁”所占比例最高,达到了 30.8%和39.2%。 最后,从图12-10的条图也可以明显看到不同性别下 各个年龄阶段的被调查人总数。
Levene统计量
df1
4
df2
280
显著性
2.495
0.043
表12-8 方差齐性检验结果表


N 47 117
86 26
秩均值 157.71 137.53
123.94 178.54
(2)秩统计表 表12-9是多独立样 本非参数检验的秩统计 表。“800元以下”的平 均秩为157.71,依次类 推。比较平均秩大小看 到,这五种收入水平的 购买顾虑值差异较大。
第三步:绘制直方图 单击【图表】按钮, 弹出【频率:图表】对话 框。在图形类型【图表类 型】中,点选直方图【直 方图】单选钮,并勾选其 下的【显示正态曲线】复 选框。再单击【继续】按 钮,返回主菜单。最后单 击【频率】对话框中的【 确定】按钮,完成本部分 操作。

方差分析SPSS

方差分析SPSS

F界值为单尾
4、根据统计推断结果,结合相应的专业知识,给出一个专 业的结论。
随机区组设计的两因素方差分析
配伍设计有两个研究因素,区组因素和处理因素。 事先将全部受试对象按某种或某些特征分为若干个 区组,使每个区组内研究对象的特征尽可能相近。 每个区组内的观察对象与研究因素的水平数k相等, 分别使每个区组内的观察对象随机地接受研究因素 某一水平的处理。
k ni
SS总=
( Xij X )2 ,总 N 1
i1 j 1
组间变异:各处理组的样本均数也大小不等。大小可用各组
均数 X i 与总均数 X 的离均差平方和表示。
k
SS组间= ni ( X i X )2 , 组间 k 1, MS组间=SS组间 组间 i 1
组内变异:各处理组内部观察值也大小不等,可用各处理组
内部每个观察值 X ij与组均数 X i 的离均差平方和表示。
k ni
SS组内=
( Xij Xi )2,组内 N k,MS组内=SS组内 组内
i1 j1
三种变异的关系
SS总 SS组间 SS组内
并且该等式和上面的等式存在如下的对应关系 总变异=随机变异+处理因素导致的变异
总变异=组内变异 + 组间变异
=0.05
2、选定检验方法,计算检验统计量
F MS处理 MS误差;F MS区组 MS误差 3、确定P值,作出推断结论
F F ,P (处理,误差 ) F F ,P (处理,误差 )
F界值为单尾
4、根据统计推断结果,结合相应的专业知识,给出一个专 业的结论。
多重比较
LSD-t 检验:适用于检验k组中某一对或某几对在 专业上有特殊意义的均数是否相等。

12章多元线性表12-9两个模型的方差分析表ANOVA'模型

12章多元线性表12-9两个模型的方差分析表ANOVA'模型

12章多元线性表12-9两个模型的方差分析表
ANOVA'模型
方差分析(ANOVA)又称“变异数分析”或“F检验”,是R。

A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。

由于各种因素的影响,研究所得的数据呈现波动状。

造成波动的原因可分成两类:一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。

方差分析的定义:
方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

方差分析的基本思想
通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

从形式上看,方差分析是比较多个总体的均值是否相等,但本质上它所研究的是变量之间的关系。

在研究一个或者多个分类型自变量与一个数值型因变量之间的关系时,方差分析是其中的主要方法之一。

这与回归分析方法有很多相同之处,但是又有本质区别。

方差分析不仅可以提高检验的效率,同时由于它将所有的样本信息结合在一起,因此增加了分析的可靠性。

一般来说,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加。

方差分析方法则是同时考虑所有的样本,因此排除了错误积累的概率,从而避免拒绝了一个真实的原假设。

第12章重复测量设计

第12章重复测量设计

重复测量设计资料的ANOV A重复测量的定义重复测量(repeated measure)是指对同一研究对象的某一观察指标在不同场合(occasion,如时间点)进行的多次测量,用于分析该观察指标在不同时间点上的变化规律。

例如,为研究某种药物对哮喘病病人的治疗效果,需要定时多次测定受试者的FEV1,以分析其的变动情况。

再如,药效研究中要观察给药后不同时间点上的血药浓度。

重复测量设计的优缺点•优点:每一个体作为自身的对照,克服了个体间的变异。

分析时可更好地集中于处理效应.因重复测量设计的每一个体作为自身的对照,所以研究所需的个体相对较少,因此更加经济。

•缺点:滞留效应(Carry-over effect)前面的处理效应有可能滞留到下一次的处理.潜隐效应(Latent effect)前面的处理效应有可能激活原本以前不活跃的效应.学习效应(Learning effect)由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高。

第一节重复测量资料ANOV A对协方差阵的要求重复测量资料方差分析的条件:1. 正态性处理因素的各处理水平的样本个体之间是相(个体内不独立)互独立的随机样本,其总体均数服从正态分布;2. 方差齐性相互比较的各处理水平的总体方差相等;3. 各时间点组成的协方差阵(covariance matrix)具有球对称(sphericity)特征。

若球形性质得不到满足,用随机区组设计方差分析的F值是有偏的,这会造成I型错误增加。

一般ANOV A 的协方差矩阵22211121222212222221222111121212211212222()(1)()()(1)a aa a aa i i i i i i i ijij ii jjs s s s s s V s s s s y y n s y y y y n y y y y n sr s s⎛⎫ ⎪ ⎪=⎪ ⎪ ⎪⎝⎭=--=---=-=∑∑∑∑∑L L M M M M L 211222222114000000aa aa s s V s s s ⎛⎫ ⎪⎪=⎪⎪ ⎪⎝⎭==LL M M M M L L对于第章,几个处理组间的协方差矩阵为:且假定重复测量资料的协方差矩阵时间点间的协方差矩阵实验前 5周后 10周后 实验前 0.081 0.090 0.065 5周后 0.386 0.411 10周后0.723时间点间的相关系数实验前 5周后 10周后 实验前 1 0.507 0.269 5周后 1 0.777 10周后122211121222212222221222111121212211212222()(1)()()(1)a aa a aa i i i i i i i ijij ii jjs s s s s s V s s s s y y n s y y y y n y y y y n sr s s⎛⎫ ⎪ ⎪=⎪ ⎪ ⎪⎝⎭=--=---=-=∑∑∑∑∑L L M M M M L球形对称的实际意义22211121222212222221222111121212211212222()(1)()()(1)a a a a aa i i i i i i i ijij ii jjs s s s s s V s s s s y y n s y y y y n y y y y n s r s s⎛⎫ ⎪ ⎪=⎪ ⎪ ⎪⎝⎭=--=---=-=∑∑∑∑∑L L M M M M L 所有两两时间点变量间差值对应的方差相等对于y i 与y j 两时间点变量间差值对应的方差可采用协方差矩阵计算为:122222222211221222i ji j i jy y y y y y y y ss s ss s s s--=+-=+-如:球形对称的实际意义举例122222222211221222i ji j i jy y y y y y y y ss s ss s s s--=+-=+-如:协方差阵A 1A 2A 3A 4A 11051015A 25201520A 310153025A 415202540s 1-22 = 10 + 20 -2(5) = 20s 1-32 = 10 + 30 -2(10) = 20s 1-42 = 10 + 40 -2(15) = 20s 2-32 = 20 + 30 -2(15) = 20s 2-42 = 20 + 40 -2(20) = 20s 3-42 = 30 + 40 -2(25) = 20本例差值对应的方差精确相等,说明球形对称。

单因素方差分析 (2)

单因素方差分析 (2)

单因素方差分析1. 引言•单因素方差分析(One-way ANOVA)是一种常用的统计方法,用于比较两个或多个组之间的均值是否存在显著差异。

•在实际研究中,我们经常需要比较不同组之间某个变量的均值差异,例如不同教育水平对收入的影响,不同药物对疾病的治疗效果等。

•单因素方差分析提供了一种统计方法,可以判断不同组之间均值差异是否由随机因素引起,还是由于真正的因素差异引起。

2. 基本概念•因素(Factor):需要比较不同组之间的变量,也称为自变量或分类因素。

•水平(Level):每个因素具有的不同取值或组别,也称为处理或条件。

•观测值(Observation):每个组内的单个实验结果或数据点。

•总平均(Grand Mean):所有组的观测值的平均值。

•组内平均(Group Mean):每个组的观测值的平均值。

•组间平均(Between-group Mean):所有组的观测值的平均值。

3. 假设检验•零假设(H0):不同组的均值之间没有显著差异。

•备择假设(H1):不同组的均值之间存在显著差异。

4. 单因素方差分析的步骤1.收集数据:按照分类因素进行分组,获得每个组的观测值。

2.计算总平均:计算所有观测值的平均值。

3.计算组内平均:计算每个组的观测值的平均值。

4.计算组间平均:计算所有组的观测值的平均值。

5.构造统计模型:建立协方差矩阵和方差矩阵之间的关系。

6.计算平方和:计算组内平方和和组间平方和。

7.计算均方差:计算组内均方差和组间均方差。

8.计算F值:计算F统计量,用于检验组间均值差异是否显著。

9.假设检验:比较F值与临界值,确定是否拒绝零假设。

5. F分布与p值•在单因素方差分析中,我们使用F分布来进行假设检验。

•F分布是一种连续概率分布,取值范围大于等于0,且分布形状根据自由度的不同而变化。

•在单因素方差分析中,我们计算出的F值可以与F分布表中的临界值进行比较,以确定是否拒绝零假设。

•p值是统计假设检验中的一个重要指标,表示在零假设成立的情况下,观察到的样本数据或更极端结果出现的概率。

第2章单因素方差分析

第2章单因素方差分析

第12章方差分析(Analysis of V ariance)方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。

在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能影响产品产量和质量特征。

有的影响大些,有的影响小些。

为了使生产过程稳定,保证优质高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。

方差分析就是处理这类问题,从中找出最佳方案。

方差分析开始于本世纪20年代。

1923年英国统计学家R.A. Fisher 首先提出这个概念,(ANOV A)。

因当时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实验上,通过分析提高农作物产量的主要因素。

Fisher1926年在澳大利亚去世。

现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。

在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水平”或“处理”(treatment)。

若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是多因素试验。

下面分别介绍单因素和双因素试验结果的方差分析。

1.1 单因素方差分析(One Way Analysis of Variance)1.一般表达形式2.方差分析的假定前提3.数学模形4.统计假设5.方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验6.举例7.多重比较1.1.1 一般表达形式首先通过一个例子引出单因素方差分析方法。

某农业科研所新培养了四种水稻品种,分别用A1,A2,A3,A4表示。

每个品种随机选种在四块试验田中,共16块试验田。

除水稻品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田中产量如下表:通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。

单因素方差分析原理

单因素方差分析原理

单因素方差分析原理
单因素方差分析是一种常用的统计方法,用于比较一个因素对于不同组之间的差异是否显著。

其基本原理是利用组内变异与组间变异之间的比较来判断因素对于不同组的影响程度。

在单因素方差分析中,我们将总体的方差分解为两个部分:组间方差和组内方差。

组间方差反映了不同组之间的差异程度,而组内方差反映了同一组内观测值之间的差异。

通过计算组间方差和组内方差的比值,可以得到F值,即F
统计量。

F统计量的大小反映了因素对于不同组之间的差异是
否显著。

如果F值显著大于1,表明组间方差较大,差异显著,因素对于不同组之间的差异有显著影响;反之,如果F值接
近1,则说明组间方差较小,差异不显著,因素对于不同组之
间的差异没有显著影响。

进行单因素方差分析时,需要满足一些基本假设,如观测值之间的独立性、组内方差的同质性等。

此外,还需要使用适当的假设检验方法和确定显著水平,以判断因素对于不同组之间的差异是否显著。

总之,单因素方差分析通过比较组内变异与组间变异,能够帮助我们判断一个因素对于不同组之间的差异是否显著,从而得出相应的结论。

这种统计方法在实验设计和数据分析中经常被应用,对于研究因素的影响具有重要的意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第12章方差分析(Analysis of V ariance)方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。

在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能影响产品产量和质量特征。

有的影响大些,有的影响小些。

为了使生产过程稳定,保证优质高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。

方差分析就是处理这类问题,从中找出最佳方案。

方差分析开始于本世纪20年代。

1923年英国统计学家R.A. Fisher 首先提出这个概念,(ANOV A)。

因当时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实验上,通过分析提高农作物产量的主要因素。

Fisher1926年在澳大利亚去世。

现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。

在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水平”或“处理”(treatment)。

若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是多因素试验。

下面分别介绍单因素和双因素试验结果的方差分析。

1.1 单因素方差分析(One Way Analysis of Variance)1.一般表达形式2.方差分析的假定前提3.数学模形4.统计假设5.方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验6.举例7.多重比较1.1.1 一般表达形式首先通过一个例子引出单因素方差分析方法。

某农业科研所新培养了四种水稻品种,分别用A1,A2,A3,A4表示。

每个品种随机选种在四块试验田中,共16块试验田。

除水稻品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田中产量如下表:通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。

类似的例子很多,如劳动生产率差异,汽车燃油消耗,金属材料淬火温度等问题。

上述问题可控实验条件是“种子”。

所以种子是因素。

把不同的品种A1,A2,A3,A4称为“水平”。

1,2,3,4表示试验批号,即每次随机的选取某个地块种某个品种的种子。

称此种问题为单因素试验。

单因素试验通常分多个试验批号,目的是平衡一些不可控因素带来的影响。

如土地的基本条件不一样。

如各品种只试验一次,必然在试验结果中含有不可控因素带来的影响。

在众多的数据中,怎样判别不同品种的水稻产量是否存在显著性差异?初步观察A 1品种的产量可能低一些,A 3,A 4的产量可能高一些。

这是从平均数上观察。

若按前面介绍的两个总体的比较,需要作C 24= 6次检验。

比较麻烦,所以需要方差分析方法。

首先从数学上给出这类问题的一般形式(单因素)这表明该可控因素共有k 个水平,每个水平都进行m 次试验,某个水平上的m 次试验可当作一个样本看待。

X i j 表示第i 个水平上第j 次试验的结果。

很容易看出当水平只有2个时,这相当于两个总体的均值的显著性检验问题。

现在的目的是要分析各个水平上的均值是否有显著性差异。

1.1.2 方差分析的假定前题 (1)每个水平(A i )上的随机变量X i 的分布都是正态的,即服从N(μi , σ2)。

但μi ,(i = 1, …, m ),σ2未知。

每个水平上的一系列观测值,看作是取自该水平正态总体的一个容量为m 的样本。

(2)认为k 个水平上的k 个总体方差相等,都是σ2(方差齐性)。

(3)观测值X i j 相互独立。

这三个假定在实际中一般都能得到满足。

1.1.3 数学模型因为X i j ~ N (μi , σ2),(i = 1, …, k )所以可以把观测值X i j 分解为两部分,即X i j = μi + e i j , (i = 1, …, k ),(j = 1, 2, …, m )其中e i j 表示X i j 对μi 的随机偏差。

为便于比较水平不同对X i j 造成的影响,可以把μi 也分解成两部分μi = μ + αi (i = 1, …, k )其中μ = ∑=ki i k 11μ,称为总平均(Grand mean ),αi 称为A i 水平上的效应,它满足∑αi = 0 把μi 代入上式则有:X i j = μ + αi + e i j , ∑αi = 0, (i =1, 2, …, k ),(j =1, 2, …, m )e i j 表示随机变量,αi 表示水平变量。

这就是单因素方差分析的数学模型。

1.1.4 统计假设:若可控因素的不同水平对试验结果无显著性影响,那么观测值X i j 应该来自同一正态总体,X i j ~ N(μ, σ2)。

所以对应的零假设是H 0:μ1 = …, μi ….= μk = μ 或 α1 =, …, = αk = 0 H 1:μi 不全相等或αi 不全为零。

当H 0成立时,样本的行平均数i X 必然差异不大,差异表现为随机误差,当H 1为真时,i X 间必存在较大差异,这时差异表现为系统误差。

1.1.5 方差分析方法为判别不同水平对试验结果有无显著性影响,关键是把观测值变量中的随机误差和系统误差分开,并能进行比较,问题就解决了。

(1) 分解总离差平方和(Total Sum of Squares ),S T =∑∑==-ki mj ij X X 112)(方法是在S T 公式中加入行平均数i X 。

S T =∑∑==-ki mj ij X X 112)(=∑∑==-+-ki mj i i ij X X X X 112)]()[(=∑∑==-k i m j i ij X X 112)(+∑∑==-k i m j i X X 112)(+∑∑==--k i mj i i ij X X X X 11))((2因为 ∑∑==--K i m j i i ij X 11))((= ∑∑==--k i mj i ij i X X X X 11)]()[(= 0所以S T =∑∑==-Ki mj ij X X 112)(=∑∑∑∑====-+-Ki mj ki mj i i ij X X X X 111122)()(令S E =∑∑-2)(i ij X XS A =∑∑==-ki mj i X X 112)(=∑=-ki i X X m 12)(则S T = S E + S A ,其中S T 称总离差平方和,总变差。

S E 称样本组内离差平方和。

它测量同一水平上因重复实验而产生的误差。

这是由于不可控因素引起的,故S E 反映的是随机误差。

S A 称样本组间离差平方和。

它表示各个水平上的样本平均数i X 与样本总平均数X 之间离差的加权平方和。

可见不同水平上的样本差异越大,S A 的值就越大。

它反映的是系统误差。

(2).求各离差平方和S T ,S A ,S E 的自由度(Degrees of freedom ),f T ,f A ,f E 。

S T =∑∑==-Ki mj ij X X 112)(的自由度。

因随机变量X ij 的个数是N 个,相互独立,但受一个约束条件。

∑∑===m i nj ij X NX 111约束,所以自由度为 N – 1,即f T = N – 1。

S A =∑∑==-ki mj i X X 112)(=∑=-ki i X X m 12)(的自由度。

因i X 的个数是k 个,但受条件∑==Ki i X m NX 11约束,所以自由度为f A = k -1。

S E =∑∑==-Ki mj i ij X X 112)(的自由度。

因X ij 的个数为N ,但受条件i X =∑=mj ij X 1,(i = 1, …, k )约束,所以自由度为f E = N – k 。

三个自由度之间也有这样的关系。

f T = f A + f E , N – 1=(N – k )+(k – 1)(3)F 检验在H 0成立条件下,X ij 服从正态分布N (μ, σ 2),又知X ij 相互独立,所以有2σTS =2112)(σ∑∑==-K i mj ij X X ~ χ2(N – 1)2σAS =2112)(σ∑∑==-K i mj i X X ~ χ2(k – 1)2σES =2112)(σ∑∑==-Ki mj i ij X X ~ χ2(N –k )且S A , S E 相互独立(证明从略)。

由抽样分布一章知,若x ~ χ2(n 1),y ~ χ2(n 2), 且x 与y 相互独立,则F =21//n y n x ~),(21n n F 当已知S A ,S E 相互独立且分别服从(k – 1)和(N – k )个自由度的χ2分布时,则有F =)()1(22k N S k S EA--σσ=)/()1/(k N S k S E A --~ F [(k –1) , ( N – k )]有了统计量F 就可以做假设检验。

怎样制定判别规则?分析如下:在H 0成立条件下,有E(1-k S A ) = E(1)(2--∑∑k X X i ) = E(1)(12--∑=k X X m ki i )= m E(1)(12--∑=k X X ki i ) = m Var )(i X = mm2σ= σ 2E(k N S E -) = E(k km S E -) = E[]1)(12--∑∑m X X k i j i =∑∑==--ki mj i ij m X X E k 1121)([1]= ∑=k i k 121σ= σ 2可见1-k S A 和kN S E -都是σ2的无偏估计量。

所以在H 0成立条件下,F =)/()1/(k N S k S E A --应接近1。

当F 值很大时,说明组间均方误差,大于组内均方误差,则不能认为k 个总体服从同一个正态分布,即拒绝H 0,否则接受H 0。

这是一个单端检验问题。

临界值由检验水平α 确定。

P{F > F α,(k – 1)(N - k )} = α 检验步骤是:(1)建立假设H :μ1 = μ2 = … = μk = μ(2)选统计量F ,H 0成立条件下F ~ F (k – 1),(N – k ) (3)由α 计算临界值F α(k – 1,N- k )(4)判别规则:若F *≤ F α(k – 1,N – k )接受H 0 若F * > F α(k – 1,N – k )拒绝H 0(5)由样本计算F *值,按判别规则给出检验结果。

通常使用方差分析表来完成F 检验。

用Eviews进行方差分析案例1 国家统计局城市社会经济调查总队1996年在辽宁、河北、山西3省的城市中分别调查了5个样本地区,得城镇居民人均年消费额(人民币元)数据如下表。

相关文档
最新文档