第五章方差分析

第五章方差分析
第五章方差分析

单因素方差分析

单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。

[例子]

调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。

表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数

数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。

图5-1

分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。

1)准备分析数据

在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存在的数据文件“DATA5-1.SAV”。

2)启动分析过程

点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统

打开单因素方差分析设置窗口如图5-2。

图5-2 单因素方差分析窗口

3)设置分析变量

因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。

因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。

4)设置多项式比较

单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。

图5-3 “Contrasts”对话框

定义多项式的步骤为:

均值的多项式比较是包括两个或更多个均值的比较。例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下:

① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。

② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。

③ 为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。依次输入各组均值的系数,在方形显示框中形成—列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。

可以同时建立多个多项式。一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。

如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单击该按钮将选中的系数清除。

④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。

本例子不做多项式比较的选择,选择缺省值。

5)设置多重比较

在主对话框里单击“Post Hoc”按钮,将打开如图5-4所示的多重比较对话框。该对话框用于设置多重比较和配对比较。方差分析一旦确定各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。

图5-4 “Post Hoc Multiple Comparisons”对话框

(1)多重比较的选择项:

①方差具有齐次性时(Equal Variances Assumed),该矩形框中有如下方法供选择:

LSD (Least-significant difference) 最小显著差数法,用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整。

Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。

Sidak 计算t统计量进行多重配对比较。可以调整显著性水平,比Bofferroni方法的界限要小。

Scheffe对所有可能的组合进行同步进入的配对比较。这些选择项可以同时选择若干个。以便比较各种均值比较方法的结果。

R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。

R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。

S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了

“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较

小的子集)的均值配对比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。

Tukey(Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误

差率作为实验误差率。

Tukey's-b用“stndent Range”分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。

Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。

Hochberg's GT2用正态最大系数进行多重比较。

Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。

Waller-Dunca用t统计量进行多重比较检验,使用贝叶斯逼近。

Dunnett指定此选择项,进行各组与对照组的均值比较。默认的对照组是最后一组。选择了该项就激活下面的“Control

Category”参数框。展开下拉列表,可以重新选择对照组。

“Test”框中列出了三种区间分别为:

?“2-sides” 双边检验;

?“

“>Conbo1”“右边检验。

②方差不具有齐次性时(Equal Varance not assumed),检验各均数间是否有差异的方祛有四种可供选择:

Tamhane's T2, t检验进行配对比较。

Dunnett's T3,采用基于学生氏最大模的成对比较法。

Games-Howell,Games-Howell比较,该方法较灵活。

Dunnett's C,采用基于学生氏极值的成对比较法。

③ Significance 选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。

本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。

6) 设置输出统计量

单击“Options”按钮,打开“Options”对话框,如图5-5所示。选择要求输出的统计量。并按要求的方式显示这些统计量。在该对话框中还可以选择对缺失值的处理要求。各组选择项的含义如下:

图5-5输出统计量的设置

“Statistics”栏中选择输出统计量:

Descriptive,要求输出描述统计量。选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量

的95%置信区间。

Fixed and random effects, 固定和随机描述统计量

Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。用“Levene lest ”检验,即计算每个观测量与其组均

值之差,然后对这些差值进行一维方差分析。

Brown-Forsythe 布朗检验

Welch,韦尔奇检验

Means plot,即均数分布图,根据各组均数描绘出因变量的分布情况。

“Missing Values”栏中,选择缺失值处理方法。

Exclude cases analysis by analysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。

Exclude cases listwise选项,对含有缺失值的观测量,从所有分析中剔除。

以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按钮,显示有关的帮助信息。

本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。

6)提交执行

设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。

7) 结果与分析

输出结果:

表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差

Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。

表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。

表5-4方差分析表:第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。第2栏是离差平方和“Sum of Squares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之和。第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为21.900,组内均方为2.400。第5栏是F值9.125(组间均方与组内均方之比)。第6栏:F值对应的概率值,针对假设H0:组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。计算的F值9.125,对应的概率值为0.002。

表5-5 LSD法进行多重比较表,从表5-4结论已知该例子的方差具有其次性,因此LSD 方法适用。第1栏的第1列“[i]品种”为比较基准品种,第2列“[j]品种”是比较品种。第2栏是比较基准品种平均数减去比较品种平均数的差值(Mean Difference),均值之间具有0.05水平(可图5-4对话框里设置)上有显著性差异,在平均数差值上用“*”号表明。第3栏是差值的标准误。第4栏是差值检验的显著性水平。第5栏是差值的95%置信范围的下限和上限。

表5-6 是多重比较的Duncan法进行比较的结果。第1栏为品种,按均数由小到大排列。第2栏列出计算均数用的样本数。第3栏列出了在显著水平0.05上的比较结果,表的最后一行是均数方差齐次性检验慨率水平,p>0.05说明各组方差具有齐次性。

多重比较比较表显著性差异差异的判读:在同一列的平均数表示没有显著性差异,反之则具有显著性的差异。例如,品种3横向看,平均数显示在第3列“2”小列,与它同列显示的有品种2的平均数,说明与品种2差异不显著(0.05水平),再往右看,平均数显示在第3列“3”小列,与它同列显示的有品种4的平均数,说明与品种4差异不显著(0.05水平)。则品种3与品种5和品种1具有显著性的差异(0.05水平)。

品种3和品种4都显示有平均数值。

结果分析:

根据方差分析表输出的p值为0.002可以看出,无论临界值取0.05,还是取0.01,p 值均小于临界值。因此否定Ho假设,水稻品种对稻纵卷叶螟幼虫抗虫性有显著性意义,结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。根据该结论选择抗稻纵卷叶螟幼虫水稻品种,犯错误的概率几乎为0.008。

只有在方差分析中F检验存在差异显著性时,才有比较的统计意义。

LSD法多重比较表明:

品种1与品种2、品种3和品种5之间存在显著性差异;

品种2与品种1和品种4之间存在显著性差异;

品种3与品种1和品种5之间存在显著性差异;

品种4与品种2和品种5之间存在显著性差异;

品种5与品种1、品种3和品种4之间存在显著性差异。

Duncan法多重比较表明:

品种5与品种3、品种4和品种1之间存在显著性差异。

品种2与品种4和品种1之间存在显著性差异;

品种3与品种5和品种1之间存在显著性差异;

品种4与品种5和品种2之间存在显著性差异;

品种1与品种5、品种2和品种3之间存在显著性差异;

两种方法比较结果一致。

多因素方差分析

多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。

[例子]

研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。

表5-7 不同温度与不同湿度粘虫发育历期表

数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据

在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。

图5-6 数据输入格式

2)启动分析过程

点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口

3)设置分析变量

设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。

设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。

设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。

设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。

设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。

4)选择分析模型

在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。

图5-8 “Univariate Model” 定义分析模型对话框

在Specify Model栏中,指定分析模型类型。

① Full Factorial选项

此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。选择该项后无需进行进一步的操作,即可单击“Continue”按钮返回主对话框。此项是系统缺省项。

② Custom选项

建立自定义的分析模型。选择了“Custom”后,原被屏蔽的“Factors & Covariates”、“Model”和“Build Term(s)”栏被激活。在“Factors & Covariates”框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量名,其变量名后面的括号中标有字母“C”。这些变量都是由用户在主对话框中定义过的。

根据表中列出的变量名建立模型,其方法如下:

在“Build Term(s)”栏右面的有一向下箭头按钮(下拉按钮),单击该按钮可以展开一小菜单,在下拉菜单中用鼠标单击某一项,下拉菜单收回,选中的交互类型占据矩形框。有如下几项选择:

?Interaction 选中此项可以指定任意的交互效应;

?Main effects 选中此项可以指定主效应;

?All 2-way 指定所有2维交互效应;

?All 3-way 指定所有3维交互效应;

?All 4-way 指定所有4维交互效应

?All 5-way 指定所有5维交互效应。

③ 建立分析模型中的主效应:

在“Build Term(s)”栏用下拉按钮选中主效应“Main effects”。

在变量列表栏用鼠标键单击某一个单个的因素变量名,该变量名背景将改变颜色(一般变为蓝色),单击“Build Term(s)”栏中的右拉箭头按钮,该变量出现在“Model”框中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。也可以在标有“F”变量名中标记多个变量同时送到“Model”框中。

本例将“a”和“b”变量作为主效应,按上面的方法选送到“Model”框中。

④ 建立模型中的交互项

要求在分析模型中包括哪些变量的交互效应,可以通过如下的操作建立交互项。

例如,因素变量有“a(F)”和“b(F)”,建立它们之间的相互效应。

?连续在“Factors &”框的变量表中单击“a(F)”和“b(F)”变量使其选中。

?单击“Build Term(s)”栏内下拉按钮,选中交互效应“Interaction”项。

?单击“Build Term(s)”栏内的右拉按钮,“a*b”交互效应就出现在“Model”框中,模型增加了一个交互效应项:a*b

⑤ Sum of squares 栏分解平方和的选择项

?Type I项,分层处理平方和。仅对模型主效应之前的每项进行调整。一般适用于:平衡的AN0VA模型,在这个模型中一阶交互

效应前指定主效应,二阶交互效应前指定一阶交互效应,依次类推;多项式回归模型。嵌套模型是指第一效应嵌套在第二

效应里,第二效应嵌套在第三效应里,嵌套的形式可使用语句指定。

?Type II项,对其他所有效应进行调整。一般适用于:平衡的AN0VA模型、主因子效应模型、回归模型、嵌套设计。

?Type III项,是系统默认的处理方法。对其他任何效应均进行调整。它的优势是把所估计剩余常量也考虑到单元频数中。对没

有缺失单元格的不平衡模型也适用,一般适用于:Type I、Type II所列的模型:没有空单元格的平衡和不平衡模型。

?Type IV顶,没有缺失单元的设计使用此方法对任何效应F计算平方和。如果F不包含在其他效应里,Type IV = Type IIIl =

TypeII。如果F包含在其他效应里,Type IV只对F的较高水平效应参数作对比。一般适用于:Type I、Type lI所列模型;

没有空单元的平衡和不平衡模型。

⑥ Include intercept in model栏选项

系统默认选项。通常截距包括在模型中。如果能假设数据通过原点,可以不包括截距,即不选择此项。

5)选择比较方法

在主对话框中单击“Contrasts”按钮,打开“Contrasts”比较设置对话框,如图5-9所示。

如图5-9 Contrasts对比设置框

在“Factors”框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的比较方法。

① 选择因子

在“Factors”框中选择想要改变比较方法的因子,即鼠标单击选中的因子。这一操作使“Change Contrast”栏中的各项被激活。

② 选择比较方法

单击“Contrast”参数框中的向下箭头,展开比较方法表。用鼠标单击选中的对照方法。可供选择的对照方法有:

?None,不进行均数比较。

?Deviation,除被忽略的水平外,比较预测变量或因素变量的每个水平的效应。可以选择“Last”(最后一个水平)或

“First”(第一个水平)作为忽略的水平。

?Simple,除了作为参考的水平外,对预测变量或因素变量的每一水平都与参考水平进行比较。选择“Last”或“First”作为

参考水平。

?Difference,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert对照

方法相反。

?Helmert,对预测变量或因素的效应,除最后一个以外,都与后续的各水平的平均效应相比较。

?Repeated,对相邻的水平进行比较。对预测变量或因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较。

?Polynomial,多项式比较。第一级自由度包括线性效应与预测变量或因素水平的交叉。第二级包括二次效应等。各水平彼此

的间隔被假设是均匀的。

③ 修改比较方法

先按步骤①选中因子变量,再选比较方法,然后单击“Change”按钮,选中的(或改变的)比较方法显示在步骤①选中的因子变量后面的括号中。

④设置比较的参考类

在“Reference Category”栏比较的参考类有两个,只有选择了“Deviation”或“Simple”方法时才需要选择参考水平。共有两种可能的选择,最后一个水平“Last”选项和第一水平“First”项。系统默认的参考水平是“Last”。

6) 选择均值图

在主对话框中单击“Plot”按钮,打开“Profile Plots”对话框,如图5-10所示。在该对话框中设置均值轮廓图。

如图5-10 “Profile Plots”对话框

均值轮廓图(Profile Plots)用于比较边际均值。轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值。如果指定了协变量,该均值则是经过协变量调整的均值。因变量做轮廓图的纵轴;一个因素变量做横轴。

做单因素方差分析时,轮廓图表明该因素各水平的因变量均值。

双因素方差分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线。如果是三因素方差分析,可以指定第三个因素变量,该因素每个水平产生一个轮廓图。双因素或多因素轮廓图中的相互平行的线表明在因素间无交互效应;不平行的线表明有交互效应。

?Factors框中为因素变量列表。

?Horlzontal Axis横坐标框,选择选择“Factors”框中一个因素变量做横坐标变量。被选的变量名反向显示,单击向右拉箭

头按钮,将变量名送入相应的横坐标轴框中。

如果只想看该因素变量各水平的,因变量均值分布,单击“Add”按钮,将所选因素变量移入下面的“Plots”框中。否

则,不点击“Add”按钮,接着做下步。

?Separate Lines分线框。如果想看两个因素变量组合的各单元格中因变量均值分布,或想看两个因变量间是否存在交互效应,

选择“Factors”框中另一个因素变量,单击右拉按钮将变量名送入“Separate Lines”框中。单击“Add”按钮,将自动生成

的图形表达式送入到“Plots”栏中。分线框中的变量的每个水平将在图中是一条线。图形表达式是用“*”连接的两个因素变

量名。

?Separate Plots分图框。如果在“Factors”栏中还有因素变量,可以按上述方法,将其送入“Separate Plot”框中,单击

“Add”按钮,将自动生成的图形表达式送入到“Plots”栏中。图形表达式是用“*’连接的三个因素变量名。分图变量的每个

水平生成一张线图。

?将图形表达式送到“Plots”框后发现有错误,单击选错的变量,单击“Remove”按钮,将其取消,再重新输入正确内容。

在检查无误后,按“Continue”按钮确认,返回到主对话框。如果取消做的设置单击“Cancel”按钮

7) 选择多重比较

在主对话框中单击“Post Hoc”选项,打开“Post Hoc Multiple Comparisons for Observed Means”对话框,从“Factor(s)”框选择变量,单击向右拉按钮,使被选变量进入“Post Hoc test for”框。本例子选择了“a”和“b”。

然后选择多重比较方法。在对话框中选择多重比较方法。本例子选择了“Duncan”和“Tamhane's T2”。

8)选择保存运算值

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案

《应用数理统计》吴翊李永乐第五章方差分析课后作业 参考答案 标准化文件发布号:(9312-EUATWW-MWUB-WUNN-INNUL-DQQTY-

第五章 方差分析 课后习题参考答案 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异(01.0=α) 解:(1)手工计算解答过程 提出原假设:() 3,2,10:0==i H i μ 记 167.20812 11112 =??? ? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.70112 112 11=???? ??-???? ??=∑∑∑∑====r i n j ij r i n j ij i A i i X n X n S 7 .137=-=A T e S S S 当 H 成立时, ()() ()r n r F r n S r S F e A ----= ,1~/1/ 本题中r=3 查表得 ()()35 .327,2,195.01==---F r n r F α且F=>,在95%的置信度下,拒绝原假 设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程

组建效应检验 Dependent Variable: 存活日数a 70.429235.215 6.903 .004 137.73727 5.101 208.167 29 方差来源菌型误差总和 平方和自由度 均值F 值P 值R Squared = .338 (Adjusted R Squared = .289) a. 从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为,对应的检验概率p 值为,小于,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 工厂 寿命(小时) 甲 40 48 38 42 45 乙 26 34 30 28 32 丙 39 40 43 50 50 试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3) i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

第五章方差分析

单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。 表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数 数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。 图5-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存在的数据文件“DATA5-1.SAV”。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图5-2。 图5-2 单因素方差分析窗口 3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较

单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。 图5-3 “Contrasts”对话框 定义多项式的步骤为: 均值的多项式比较是包括两个或更多个均值的比较。例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下: ① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。 ② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。 ③ 为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。依次输入各组均值的系数,在方形显示框中形成—列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。 可以同时建立多个多项式。一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。

第五章方差分析练习

方差分析练习 1、 一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上是 一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是低级管理者。该咨询公司认为,不同层次的管理者对两座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是从1~10,10代表非常满意)。取显著性水平05.0=α,检验管理者的水平不同是否会导致评分的显著性 差异。 2、 某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货, 为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h )数据如下。试分析三个企业生产的电池的平均寿命之间有无显著差异(α=005.)。如果有差异,试用多重比较检验哪些企业之间有差异? 3、 一家产品制造公司管理者想比较A 、B 、C 三种不同的培训方式对产品组装时间的多 少是否有显著影响,将20名新员工随机分配给每种培训方式。在培训结束后,参加培训的员工组装一件产品所花的时间(单位:min )如下。取显著性水平05.0=α,确定不同培训方式对产品组装的时间是否有显著影响。 4、一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮胎供应商和耐磨程度。为了对磨损程度进行测试,分别在低速(40km/h )、中速(80km/h )、高速(120km/h )下进行测试。下表是对5家供应商抽取的轮胎随机样本在轮胎使用1000km 后磨损程度。取显著性水平01.0=α,检验:

(1) 用单因素方差分析分析不同车速对磨损程度是否有显著影响。 (2) 用单因素方差分析分析不同供应商生产的轮胎之间磨损程度是否有显著差异; (3) 用双因素方差分析分析这两个因素是否显著,与前面的分析是否有矛盾,为什么会产生这这种矛盾? 5.一家超市连锁店的老板进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。获得的月销售额数据(单位:万元)见下表。取显著性水平01.0=α,检验: (1) 竞争者的数量对销售额是否有显著影响。 (2) 超市的位置对销售额是否有显著影响。 (3)竞争者的数量和超市的位置对销售额是否有交互影响。 6.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售量数据见下表。检验广告方案、广告媒体或其交互作用对销售量的影响是否显著。(α=005.)

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案资料

第五章 方差分析 课后习题参考答案 5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α) 解:(1)手工计算解答过程 提出原假设:()3,2,10:0==i H i μ 记 167.20812 11112 =???? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.7011 2 11211=???? ??-???? ??=∑∑∑ ∑====r i n j ij r i n j ij i A i i X n X n S 7.137=-=A T e S S S 当 0H 成立时, ()()()r n r F r n S r S F e A --- -= ,1~/1/ 本题中r=3 经过计算,得方差分析表如下: 查表得 ()()35.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原 假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程

从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异?并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3)i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 3.对于各组之间的均值进行检验。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

统计学教案习题05方差分析

统计学教案习题05方 差分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组间)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=21)(x x n k i i i -∑= , 组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ????-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。

统计学教案习题05方差分析

第五章方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1)多组计量资料总变异的分解,组间变异和组内变异的概念。 (2)多组均数比较的检验假设与F值的意义。 (3)方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t检验法;Dunnett-t检验法;SNK-q检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1.基本思想 方差分析(analysis of variance,ANOVA)的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups),组间变异反映

第五章方差分析作业

第五章 方差分析 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3)i N i μσ= 。 解: 一、 手工计算过程: 1.计算平方和 其检验假设为:H 0:,H 1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 3.对于各组之间的均值进行检验。 对于各组之间的均值进行检验有LSD-t 检验和q 检验。SPSS 选取LSD 检验(最小显著差t 检验),原理如下: 其检验假设为:H 0:,H 1:。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

方法为:首先计算拒绝H 0,接受H 1所需样本均数差值的最小值,即LSD (the least significant difference ,LSD )。然后各对比组的与相 应的LSD 比较,只要对比组的大于或等于LSD ,即拒绝H 0,接受H 1;否 则,得到相反的推断结论。 LSD-t 检验通过计算各对比组的与其标准误之比值是否达到t 检验的界 值 )() 11(| |2 1B r N t n n MS x x B A e A -≥+--α 由此推算出最小显著差LSD ,而不必计算每一对比组的t 值 )11( )(||2 1B B A e A n n MS r N t x x LSD +-≥-=-α 如果两对比组的样本含量相同,即时,则 n MS r N t x x LSD e A 2)(||2 1B -≥-=-α 的置信区间为:B A μμ- )(n MS r N t x x e A 2)(||21B -±--α 则本题中 686.25 033 .18*22==n MS e 852.5686.2*1788.2686.2*)12(2 )(975.012 ===--t n MS r N t e α

统计学教案习题05方差分析

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOV A )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组 间 )表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间= 21 )(x x n k i i i -∑= ,组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ? ???-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。 (3)总变异:所有观察值之间的变异(不分组),这种变异叫做总变异(total variation)。其大小可用全体数据的方差表示, 也称总均方(MS 总 )。按方差的计算方法,MS 总= 总总ν/SS ,其中SS 总=211 )(∑∑==-k i n j ij i x x , k 为处理组数,i n 为第i 组例数,总ν=N -1为总的自由度, N 表示总例数。 (二)方差分析的应用条件 (1) 各样本是相互独立的随机样本,且来自正态分布总体。 (2) 各样本的总体方差相等,即方差齐性(homoscedasticity)。

第五章方差分析练习

方差分析练习 1、 一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上是 一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是低级管理者。该咨询公司认为,不同层次的管理者对两座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是从1~10,10代表非常满意)。取显著性水平05.0=α,检验管理者的水平不同是否会导致评分的显著性差异。 2、 3、 4、 5、 6、 7、 ( 8、 某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货, 为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h )数据如下。试分析三个企业生产的电池的平均寿命之间有无显著差异(α=005.)。如果有差异,试用多重比较检验哪些企业之间有差异 . 9、 一家产品制造公司管理者想比较A 、B 、C 三种不同的培训方式对产品组装时间的多 少是否有显著影响,将20名新员工随机分配给每种培训方式。在培训结束后,参加培训的员工组装一件产品所花的时间(单位:min )如下。取显著性水平05.0=α,确定不同培训方式对产品组装的时间是否有显著影响。 }

4、一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮胎供应商和耐磨程度。为了对磨损程度进行测试,分别在低速(40km/h )、中速(80km/h )、高速(120km/h )下进行测试。下表是对5家供应商抽取的轮胎随机样本在轮胎使用1000km 后磨损程度。取显著性水平01.0=α,检验: (1) 用单因素方差分析分析不同车速对磨损程度是否有显著影响。 (2) 用单因素方差分析分析不同供应商生产的轮胎之间磨损程度是否有显著差异; (3) 用双因素方差分析分析这两个因素是否显著,与前面的分析是否有矛盾,为什么 5.一家超市连锁店的老板进行一项研究,确定超市所在的位置和竞争者的数量对销售额是 否有显著影响。获得的月销售额数据(单位:万元)见下表。取显著性水平01.0=α,检验: (1) 竞争者的数量对销售额是否有显著影响。 (2) 超市的位置对销售额是否有显著影响。 / 6.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售量数据见下表。检验广告方案、广告媒体或其交互

应用统计学习题:方差分析

第五章方差分析 序号:5-004 题型:名词解释题 章节:方差分析 题目:方差分析的任务 答案:①求参数μ、μj 、α1、α2……αm的估计值(参数估计) ②分析观测值的偏差 ③检验各水平效应α1、α2……αm(等价μ1、μ2……μm)有无显著差异难度:高 评分标准:每题2分,少一条扣去1分。 序号:5-002 题型: 判断题 章节:方差分析 题目:方差分析是一种比较总体方差差异的统计方法。() 答案:错误 难度:中 评分标准:1分 序号:5-003 题型:综合题 章节:方差分析 题目:设有三个车间以不同的工艺生产同一种产品,为考察不同工艺对产品产量的影响,现对每个车间各纪录5天的日产量,如表所示,问三个车间的日产量是否有显著差异? (取α=0.05)。

F >)12,2(05.0F 存在显著差异。 解:(1)计算各水平均值和总平均值,465 46 484745441=++++= X , 同理46,5232==X X ,483 46 5246=++=X (2’分) (2)计算总离差平方和S T ,组内平方和S E ,组间平方和S A 。 S T =(44-48)2+(46-48)2+……(45-48)2=172 (1’分) S A =Σ120)4846(5)4852(5)4846(5)(2222j =-+-?+-=-X X (1’分) S E =S T -S A =172-120=52(1’分) (3)计算方差 MS A = 6013120=- MS E =33.43 1552 =-(1’分) (4)作F 检验 85.1333 .460 === E A MS MS F (1’分) 89.3)21,2(),1(05.02==--F m n m F (1’分) 难度:中 评分标准: 每题8分 序号:5-004 题型:综合题 章节:方差分析 题目: 有重复双因素方差分析,A 因素有3个水平,B 因素有3个水平,在A i 、B j 所有可能组合条件下,重复观测2次。试用观测值X ijk 、均值??i X 、 ??j X ……, i =1、2……n , j =1、2……m , k =1、2…… l 制表。并指定Excel 单元格对应。

相关文档
最新文档