spss方差分析报告报告材料

spss方差分析报告报告材料
spss方差分析报告报告材料

方差分析是用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。

在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。

方差分析原理

方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:

(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。

(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。

总偏差平方和 SS t = SS b + SS w。

组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MS b>>MS w(远远大于)。

MS b/MS w比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。

方差分析的假设检验

假设有m个样本,如果原假设H0:样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共同的方差。则m个样本来自具有共同的方差和相同的均数u的总体。

零假设H0:m组样本均值都相同,即μ1= μ2=....= μm

如果,计算结果的组间均方远远大于组内均方(MS b>>MS w),F>F0.05(dfb,dfw), p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;否则, F0.05不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。

SPSS中方差分析过程

1)One-Way ANOVA过程

One-Way过程是单因素简单方差分析过程。它在Analyze菜单中的Compare Means过程组中。用0ne-Way ANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。

2)General Linear Model 过程组

在SPSS主菜单“Analyze”项调用。这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。该过程允许指定最高阶次的交互效应,建立包括所有效应的模型。如果想建立包括某些特定的交互效应的模型也可以通过过程中的“Method”对话框中的选择项实现。

在General Linear Model菜单项的下一级菜单中有四项过程,每个菜单项分别完成不同类型的方差分析任务。这些过程的主要功能分别是:

① Univariate 过程

Univariate过程完成一般的单因变量、多因素方差分析。可以指定协变量,即进行协方差分析。在指定模型方面有较大的灵活性并可以提供大量的统计输出。

② Multivariate过程

Multivariate过程进行多因变量的多因素分析。当研究的问题具有两个或两个以上相关的因变量时,要研究一个或几个因素变量与因变量集之间的关系时,才可以选用Multivariate过程。例如,当你研究数学、物理的考试成绩是否与教学方法、学生性别、以及方法与性别的交互作用有关时,使用此菜单项。如果只有几个不相关的因变量或只有一个因变量,应该使用Univariate过程。

③ Repeated Measure过程

Repeated Measure过程进行重复测量方差分析。当一个因变量在不只一种条件下进行测度,要检验有关因变量均值的假设应该使用该过程。

④ Variance Component 过程

Variance Component过程进行方差估计分析。通过计算方差估计值,可以帮助我们分析如何减小方差。

单因素方差分析

单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。

[例子]

调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。

表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数

1 41 33 38 37 31

2 39 37 35 39 34

3 40 35 35 38 34

数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。

图5-1

分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。

1)准备分析数据

在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存在的数据文件“DATA5-1.SAV”。

2)启动分析过程

点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统

打开单因素方差分析设置窗口如图5-2。

图5-2 单因素方差分析窗口

3)设置分析变量

因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。

因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。

4)设置多项式比较

单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。

图5-3 “Contrasts”对话框

定义多项式的步骤为:

均值的多项式比较是包括两个或更多个均值的比较。例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下:

①选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。

②单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。

③为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。依次输入各组均值的系数,在方形显示框中形成—列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。

可以同时建立多个多项式。一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。

如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单击该按钮将选中的系数清除。

④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。

本例子不做多项式比较的选择,选择缺省值。

5)设置多重比较

在主对话框里单击“Post Hoc”按钮,将打开如图5-4所示的多重比较对话框。该对话框用于设置多重比较和配对比较。方差分析一旦确定各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。

图5-4 “Post Hoc Multiple Comparisons”对话框

(1)多重比较的选择项:

①方差具有齐次性时(Equal Variances Assumed),该矩形框中有如下方法供选择:

LSD (Least-significant difference) 最小显著差数法,用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整。

Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。

Sidak 计算t统计量进行多重配对比较。可以调整显著性水平,比Bofferroni 方法的界限要小。

Scheffe对所有可能的组合进行同步进入的配对比较。这些选择项可以同时选择若干个。以便比较各种均值比较方法的结果。

R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。

R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。

S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了

“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较

小的子集)的均值配对比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。

Tukey(Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误

差率作为实验误差率。

Tukey's-b用“stndent Range”分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。

Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。

Hochberg's GT2用正态最大系数进行多重比较。

Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。

Waller-Dunca用t统计量进行多重比较检验,使用贝叶斯逼近。

Dunnett指定此选择项,进行各组与对照组的均值比较。默认的对照组是最后一组。选择了该项就激活下面的“Control

Category”参数框。展开下拉列表,可以重新选择对照组。

“Test”框中列出了三种区间分别为:

?“2-sides”双边检验;

?“

?“>Conbo1”“右边检验。

②方差不具有齐次性时(Equal Varance not assumed),检验各均数间是否有差异的方祛有四种可供选择:

Tamhane's T2, t检验进行配对比较。

Dunnett's T3,采用基于学生氏最大模的成对比较法。

Games-Howell,Games-Howell比较,该方法较灵活。

Dunnett's C,采用基于学生氏极值的成对比较法。

③ Significance 选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。

本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。

6) 设置输出统计量

单击“Options”按钮,打开“Options”对话框,如图5-5所示。选择要求输出的统计量。并按要求的方式显示这些统计量。在该对话框中还可以选择对缺失值的处理要求。各组选择项的含义如下:

图5-5输出统计量的设置

“Statistics”栏中选择输出统计量:

Descriptive,要求输出描述统计量。选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量

的95%置信区间。

Fixed and random effects, 固定和随机描述统计量

Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。用“Levene lest ”检验,即计算每个观测量与其组均

值之差,然后对这些差值进行一维方差分析。

Brown-Forsythe 布朗检验

Welch,韦尔奇检验

Means plot,即均数分布图,根据各组均数描绘出因变量的分布情况。

“Missing Values”栏中,选择缺失值处理方法。

Exclude cases analysis by analysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。

Exclude cases listwise选项,对含有缺失值的观测量,从所有分析中剔除。

以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按钮,显示有关的帮助信息。

本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。

6)提交执行

设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。

7) 结果与分析

输出结果:

表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差

Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。

表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。

表5-4方差分析表:第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。第2栏是离差平方和“Sum of Squares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之和。第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为21.900,组内均方为2.400。第5栏是F值9.125(组间均方与组内均方之比)。第6栏:F值对应的概率值,针对假设H0:组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。计算的F值9.125,对应的概率值为0.002。

表5-5 LSD法进行多重比较表,从表5-4结论已知该例子的方差具有其次性,因此LSD 方法适用。第1栏的第1列“[i]品种”为比较基准品种,第2列“[j]品种”是比较品种。第2栏是比较基准品种平均数减去比较品种平均数的差值(Mean Difference),均值之间具有0.05水平(可图5-4对话框里设置)上有显著性差异,在平均数差值上用“*”号表明。第3栏是差值的标准误。第4栏是差值检验的显著性水平。第5栏是差值的95%置信范围的下限和上限。

表5-6 是多重比较的Duncan法进行比较的结果。第1栏为品种,按均数由小到大排列。第2栏列出计算均数用的样本数。第3栏列出了在显著水平0.05上的比较结果,表的最后一行是均数方差齐次性检验慨率水平,p>0.05说明各组方差具有齐次性。

多重比较比较表显著性差异差异的判读:在同一列的平均数表示没有显著性差异,反之则具有显著性的差异。例如,品种3横向看,平均数显示在第3列“2”小列,与它同列显示的有品种2的平均数,说明与品种2差异不显著(0.05水平),再往右看,平均数显示在第3列“3”小列,与它同列显示的有品种4的平均数,说明与品种4差异不显著(0.05水平)。则品种3与品种5和品种1具有显著性的差异(0.05水平)。

品种3和品种4都显示有平均数值。

结果分析:

根据方差分析表输出的p值为0.002可以看出,无论临界值取0.05,还是取0.01,p 值均小于临界值。因此否定Ho假设,水稻品种对稻纵卷叶螟幼虫抗虫性有显著性意义,结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。根据该结论选择抗稻纵卷叶螟幼虫水稻品种,犯错误的概率几乎为0.008。

只有在方差分析中F检验存在差异显著性时,才有比较的统计意义。

LSD法多重比较表明:

品种1与品种2、品种3和品种5之间存在显著性差异;

品种2与品种1和品种4之间存在显著性差异;

品种3与品种1和品种5之间存在显著性差异;

品种4与品种2和品种5之间存在显著性差异;

品种5与品种1、品种3和品种4之间存在显著性差异。

Duncan法多重比较表明:

品种5与品种3、品种4和品种1之间存在显著性差异。

品种2与品种4和品种1之间存在显著性差异;

品种3与品种5和品种1之间存在显著性差异;

品种4与品种5和品种2之间存在显著性差异;

品种1与品种5、品种2和品种3之间存在显著性差异;

两种方法比较结果一致。

多因素方差分析

多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。

[例子]

研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。

表5-7 不同温度与不同湿度粘虫发育历期表

100 25 91.2 95.0 93.8 93.0 27 87.6 84.7 81.2 82.4 29 79.2 67.0 75.7 70.6 31 65.2 63.3 63.6 63.3

80 25 93.2 89.3 95.1 95.5 27 85.8 81.6 81.0 84.4 29 79.0 70.8 67.7 78.8 31 70.7 86.5 66.9 64.9

40 25 100.2 103.3 98.3 103.8 27 90.6 91.7 94.5 92.2 29 77.2 85.8 81.7 79.7 31 73.6 73.2 76.4 72.5

数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据

在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。

图5-6 数据输入格式

2)启动分析过程

点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口

3)设置分析变量

设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。

设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。

设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。

设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。

设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。

4)选择分析模型

在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。

图5-8 “Univariate Model”定义分析模型对话框

在Specify Model栏中,指定分析模型类型。

① Full Factorial选项

此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。选择该项后无需进行进一步的操作,即可单击“Continue”按钮返回主对话框。此项是系统缺省项。

② Custom选项

建立自定义的分析模型。选择了“Custom”后,原被屏蔽的“Factors & Covariates”、“Model”和“Build Term(s)”栏被激活。在“Factors & Covariates”框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量名,其变量名后面的括号中标有字母“C”。这些变量都是由用户在主对话框中定义过的。

根据表中列出的变量名建立模型,其方法如下:

在“Build Term(s)”栏右面的有一向下箭头按钮(下拉按钮),单击该按钮可以展开一小菜单,在下拉菜单中用鼠标单击某一项,下拉菜单收回,选中的交互类型占据矩形框。有如下几项选择:

?Interaction 选中此项可以指定任意的交互效应;

?Main effects 选中此项可以指定主效应;

?All 2-way 指定所有2维交互效应;

?All 3-way 指定所有3维交互效应;

?All 4-way 指定所有4维交互效应

?All 5-way 指定所有5维交互效应。

③建立分析模型中的主效应:

在“Build Term(s)”栏用下拉按钮选中主效应“Main effects”。

在变量列表栏用鼠标键单击某一个单个的因素变量名,该变量名背景将改变颜色(一般变为蓝色),单击“Build Term(s)”栏中的右拉箭头按钮,该变量出现在“Model”框中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。也可以在标有“F”变量名中标记多个变量同时送到“Model”框中。

本例将“a”和“b”变量作为主效应,按上面的方法选送到“Model”框中。

④建立模型中的交互项

要求在分析模型中包括哪些变量的交互效应,可以通过如下的操作建立交互项。

例如,因素变量有“a(F)”和“b(F)”,建立它们之间的相互效应。

?连续在“Factors &”框的变量表中单击“a(F)”和“b(F)”变量使其选中。

?单击“Build Term(s)”栏内下拉按钮,选中交互效应“Interaction”项。

?单击“Build Term(s)”栏内的右拉按钮,“a*b”交互效应就出现在“Model”框中,模型增加了一个交互效应项:a*b

⑤ Sum of squares 栏分解平方和的选择项

?Type I项,分层处理平方和。仅对模型主效应之前的每项进行调整。一般适用于:平衡的AN0VA模型,在这个模型中一阶交互

效应前指定主效应,二阶交互效应前指定一阶交互效应,依次类推;多项式回归模型。嵌套模型是指第一效应嵌套在第二

效应里,第二效应嵌套在第三效应里,嵌套的形式可使用语句指定。

?Type II项,对其他所有效应进行调整。一般适用于:平衡的AN0VA模型、主因子效应模型、回归模型、嵌套设计。

?Type III项,是系统默认的处理方法。对其他任何效应均进行调整。它的优势是把所估计剩余常量也考虑到单元频数中。对没

有缺失单元格的不平衡模型也适用,一般适用于:Type I、Type II所列的模型:没有空单元格的平衡和不平衡模型。

?Type IV顶,没有缺失单元的设计使用此方法对任何效应F计算平方和。如果F不包含在其他效应里,Type IV = Type IIIl =

TypeII。如果F包含在其他效应里,Type IV只对F的较高水平效应参数作对比。一般适用于:Type I、Type lI所列模型;

没有空单元的平衡和不平衡模型。

⑥ Include intercept in model栏选项

系统默认选项。通常截距包括在模型中。如果能假设数据通过原点,可以不包括截距,即不选择此项。

5)选择比较方法

在主对话框中单击“Contrasts”按钮,打开“Contrasts”比较设置对话框,如图5-9所示。

如图5-9 Contrasts对比设置框

在“Factors”框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的比较方法。

①选择因子

在“Factors”框中选择想要改变比较方法的因子,即鼠标单击选中的因子。这一操作使“Change Contrast”栏中的各项被激活。

②选择比较方法

单击“Contrast”参数框中的向下箭头,展开比较方法表。用鼠标单击选中的对照方法。可供选择的对照方法有:

?None,不进行均数比较。

?Deviation,除被忽略的水平外,比较预测变量或因素变量的每个水平的效应。可以选择“Last”(最后一个水平)或

“First”(第一个水平)作为忽略的水平。

?Simple,除了作为参考的水平外,对预测变量或因素变量的每一水平都与参考水平进行比较。选择“Last”或“First”作为

参考水平。

?Difference,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert对照

方法相反。

spss实验报告---方差分析

实验报告 ——(方差分析) 一、实验目的 熟练使用SPSS软件进行方差分析。学会通过方差分析分析不同水平的控制变量是否对结果产生显著影响。 二、实验内容 1、某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?(自建数据集) 石棉肺患者可疑患者非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 SPSS计算结果: 在建立数据集时定义group1为石棉肺患者,group2为可疑患者,group3为非患者。 零假设:各水平下总体方差没有显著差异。 相伴概率为0.075,大于0.05,可以认为各个组的方差是相等的,可以进行方差检验。

从上表可以看出3个组之间的相伴概率都小于显著性水平0.05,拒绝零假设,说明3个组之间都存在显著差别。 2、某汽车经销商在不同城市进行调查汽车的销售量数据分析工作,每个城市分别处于不同的区域:东部、西部和中部,而且汽车经销商在不同城市投放不同类型的广告,调查数据放置于附件中数据文件“汽车销量调查.sav”。 (1)试分析不同区域与不同广告类型是否对汽车的销量产生显著性的影响?(2)如果考虑到不同城市人均收入具有差异度时,再思考不同区域和不同广告类型对汽车销量产生的影响差异是否改变,这说明什么问题? SPSS计算结果: (1)此为多因素方差分析 相伴概率为0.054大于0.05,可以认为各个组总体方差相等可以进行方差检验。

spss方差分析

方差分析是用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。 方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。 在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。 方差分析原理 方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。 (2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。 总偏差平方和 SS t = SS b + SS w。 组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MS b>>MS w(远远大于)。 MS b/MS w比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。 方差分析的假设检验

spss的数据分析案例精选文档

s p s s的数据分析案例 精选文档 TTMS system office room 【TTMS16H-TTMS2A-TTMS8Q8-

关于某公司474名职工综合状况的统计分析报告一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin (起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分 析能够了解变量的取值状况,对把握数据的分布特征非常有用。 此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为%和%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

16 59 17 11 18 9 19 27 20 2 .4 .4 21 1 .2 .2 Tot al 474 上 表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的%,其次为15年,共有116人,占中人数的%。且接受过高于20年的教育的人数只有1人,比例很低。 2、 描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的

Spss数据分析报告

2 2 SPSS 期末报告 关于员工受教育程度对其工资水 平的影响统计分析报告 SPSS 统计分析方法 姓汤重阳 号:学 三班所在班级: 目录 一、 数据样本描 述 ..................... 二、 要解决的问题描 述 ..................... 1数据管理与软件入门部分 1 1.1分类汇总 ............ 1.2个案排秩 ............ 1.3连续变量变分组变量 2统计描述与统计图表部分 2.1频数分析.…… 2.2描述统计分析 3假设检验方法部分 2 3.1分布类型检验 3.1.1 正态分布. 3.1.2 二项分布. 课程名称: 名: 人力资源管理 所在专业:

3.1.3 游程检验 (2) 3.2 单因素方差分析 (2) 3.3 卡方检验 (2) 3.4 相关与线性回归的分析方法 (2) 3.4.1 相关分析(双变量相关分析&偏相关分析) (2) 3.4.2 线性回归模型 (2) 4 高级阶段方法部分..................................... 2 三、具体步骤描述 (3) 1 数据管理与软件入门部分.................................. 3 1.1 分类汇总 (3) 1.2 个案排秩 (3) 1.3 连续变量变分组变量 (4) 5 ........................................................ 统计描述与统计图表部 分2 2.1 频数分析 (5) 2.2 描述统计分析 (6) 3 假设检验方法部分..................................... 7 3.1 分布类型检验 (7) 3.1.1 正态分布 (7) 3.1.2 二项分布 (8) 3.1.3 游程检验 (9) 3.2 单因素方差分析 (10) 3.3 卡方检验 (12) 3.4 相关与线性回归的分析方法 (13) 3.4.1 相关分析 (13) 3.4.2 线性回归模型 (15) 4 高级阶段方法部分..................................... 16 4.1 信度 (16) 71 ................................................................... 效度4.2 一、数据样本描述 分析数据来自于“微盘一一SPSS数据包data02-01 ”。 本次分析的数据为某公司474名职工状况统计表,其中共包含11 个变量,分别是: id (职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度), jobcat (职务等级),salbegin (起始工资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。

SPSS学习系列2方差分析报告

22. 方差分析 一、方差分析原理 1. 方差分析概述 方差分析可用来研究多个分组的均值有无差异,其中分组是按影响因素的不同水平值组合进行划分的。 方差分析是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。 方差分析,是用来检验两个或两个以上均值间差别显著性(影响观察结果的因素:原因变量(列变量)的个数大于2,或分组变量(行变量)的个数大于1)。一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。 方差分析可用于: (1)完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设计和正交设计等资料; (2)可对两因素间交互作用差异进行显著性检验; (3)进行方差齐性检验。 要比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方(Mean Square)。

2. 基本思想 基本思想是,将所有测量值上的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。 根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以各自的自由度得出各部分的均方,然后列出方差分析表算出F检验值,作出统计推断。 方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。 效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。 当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。

spss的数据分析案例

关于某公司474名职工综合状况的统计分析报告 一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够 了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

14 6 1.3 1.3 52.5 15 116 24.5 24.5 77.0 16 59 12.4 12.4 89.5 17 11 2.3 2.3 91.8 18 9 1.9 1.9 93.7 19 27 5.7 5.7 99.4 20 2 .4 .4 99.8 21 1 .2 .2 100.0 Tot 474 100.0 100.0 al 上表及其 直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教

SPSS处理多元方差分析例子

实验三多元方差分析 一、实验目的 用多元方差分析说明民族和城乡对人均收入和文化程度的影响。 二、实验要求 调查24个社区,得到民族与城乡有关数据如下表所示,其中人均收入为年 均,单位百元。文化程度指15岁以上小学毕业文化程度者所占百分比。试依此 数据通过方差分析说明民族和城乡对人均收入和文化程度的影响。 三、实验内容 1.依次点击“分析”---- “常规线性模型”----“多变量”,将“人均收入”和“文化程度” 加到“因变量”中,将“民族”和“居民”加到“固定因子”中,如下图一所示。 民族农村城市 人均收入文化程度人均收入文化程度 1 46,50,60,68 70,78,90,93 52,58,72,75 82,85,96,98 2 52,53,63,71 71,75,86,88 59,60,73,77 76,82,92,93 3 54,57,68,69 65,70,77,81 63,64,76,78 71,76,86,90

【图一】 2.点击“选项”,将“输出”中的相关选项选中,如下图二所示: 【图二】 3.点击“继续”,“确定”得到如下表一的输出:

【表一】 常规线性模型 主体间因子 值标签N 民族 1.00 1 8 2.00 2 8 3.00 3 8 居民 1.00 农村12 2.00 城市12 描述性统计量 民族居民均值标准差N 人均收入1 农村56.0000 9.93311 4 城市64.2500 11.02648 4 总计60.1250 10.66955 8 2 农村59.7500 8.99537 4 城市67.2500 9.10586 4 总计63.5000 9.28901 8 3 农村62.0000 7.61577 4 城市70.2500 7.84750 4 总计66.1250 8.40812 8 总计农村59.2500 8.45442 12 城市67.2500 8.89458 12 总计63.2500 9.41899 24 文化程度1 农村82.7500 10.68878 4 城市90.2500 7.93200 4 总计86.5000 9.59166 8

SPSS方差分析案例实例

SPSS 第二次作业——方差分析 1、案例背景: 在一些大型考试中,为了保证结果的准确和一致性,通常针对一些主观题,都采取由多个老师共同评审的办法。在评分过程中,老师对学生的信息不可见,同时也无法看到其他评分,保证了结果的公正性。然而也有特殊情况的发生,导致了成绩的不稳定,这就使得对不同教师的评分标准考察变得十分必要。 2、案例所需资料及数据的获取方式和表述,变量的含义以及类型: 所需资料:抽样某地某次考试中不同教师对不同的题目的学生成绩的评分; 获取方式:让一组学生前后参加四次考试,由三位教师进行批改后收集数据; 变量含义、类型:一份试卷的每道主观题由三名教师进行评定,3个教师的评定结果可看成事从同一总体中抽出的3个区组,它们在四次评定的成绩是相关样本。 表1如下: 3、分析方法: 用方差分析的方法对四个总体的平均数差异进行综合性的F 检验。 4、数据的检验和预处理: a) 奇异点的剔除:经检验得无奇异点的剔除; b) 缺失值的补齐:无; c) 变量的转换(虚拟变量、变量变换):无; d) 对于所用方法的假设条件的检验:进行正态性和方差齐性的检验。 正态性,用QQ 图进行分析得下图: 教师 题目 1 2 3 a 27.3 28.5 29.1 b 29.0 29.2 28.3 c 26.5 28.2 29.3 d 29.7 25.7 27.2

得到近似满足正态性。 ?对方差齐性的检验: 用SPSS对方差齐性的分析得下表: Test of Homogeneity of Variances 分数 Levene Statistic df1 df2 Sig. .732 2 9 .508 易知P〉0.05,接受方差齐性的假设。 5、分析过程: a) 所用方法:单因素方差分析;方差分析中的多重比较。 b) 方法细节: ●单因素方差分析 第一步,提出假设: H0:μ1=μ2=μ3;(教师的评定基本合理,即均值相同) H1:μi(i=1,2,3)不全相等;(教师的评定不够合理,均值有差异)第二步,为检验H0是否成立,首先计算以下统计量:

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 第一,将EXCEL中的原始数据导入到SPSS软件中; 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。

数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0--1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行数据的Z标准化。 所的结论: 标准化后的所有指标数据。 注意: SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。 factor过程对数据进行因子分析(指标之间的相关性判定略)。 【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表;

【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框; 【3】设置“抽取”,勾选“碎石图”复选框; 【4】设置“旋转”,勾选“最大方差法”复选框; 【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框; 【6】查看分析结果。 所做工作: a.查看KMO和Bartlett 的检验 KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析; Bartlett 球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相关关系。 所的结论: 符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。 注意: 1.KMO(Kaiser-Meyer-Olkin) KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。 Kaiser给出了常用的kmo度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般; 0.6表示不太适合;0.5以下表示极不适合。 2.Bartlett 球度检验: 巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显著性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。 Bartlett 球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为0.001小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。 所做工作: b. 全部解释方差或者解释的总方差(Total Variance Explained)

spss的数据分析报告

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状 况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。 首先,对该地区的男女性别分布进行频数分析,结果如下 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表:

其次对原有数据中的是否进通道进行频数分析,结果如下表:

表说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。 上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。 2、探索性数据分析 (1)交叉分析。 通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分): Count

SPSS大数据案例分析实施报告

SPSS数据案例分析 目录 _Toc438655006 一.手机APP 广告点击意愿的模型构建 (2) 1.1构建研究模型 (2) 1.2研究变量及定义 (2) 1.3研究假设 (2) 1.4变量操作化定义 (2) 1.5问卷设计 (2) 二.实证研究 (2) 2.1基础数据分析 (2) 2.2频数分布及相关统计量 (2) 2.3相关分析 (2) 2.4回归分析 (2) 2.5假设检验 (2)

一.手机APP 广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在30 岁以下的人群占到70%以上,因此本研究考虑性别了这一变量,同时根据手机APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对UTAUT 模型进行扩展,构建了手机APP 广告点击意愿的影响因素研究模型。

1.3研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机APP 点击意向的关系 H1:用户的广告效用期望与点击手机APP 广告意愿正相关。 H2:用户的APP 效用期望与点击手机APP 广告意愿正相关 H3:社会影响与手机APP 广告点击意愿正相关 (2)感知风险与点击手机APP 广告意愿的关系 H4:感知风险与手机APP 广告点击意愿负相关 H5:性别,手机流量对手机APP 广告点击意愿没有显著影响

多元方差分析spss实例

多元方差分析 1992年美国总统选举的三位候选人为布什、佩罗特、克林顿。从支持三位候选人的选民中分别 分析:该题自变量为三位候选人,因变量为年龄段和受教育程度。从自变量来看要进行方差分析,从因变量来看是二元分析,所以最终确定使用多变量分析 具体操作(spss) 1、打开spss,录入数据,定义变量和相应的值在此不作详述。结果如图1

图1 被投票人:1、布什2、佩罗特3、克林顿 2、在spss窗口中选择分析——一般线性模型——多变量,调出多变量分析主界面,将年龄段和受 教育程度移入因变量框中,被投票人移入固定因子框中。如图2 图2 多变量分析主界面 3、点击选项按钮在输出框中选择方差齐性分析(既包括协方差矩阵等同性分析也包括误差方差齐 性分析),其它使用默认即可,点击继续返回主界面。如图3

图3 选项子对话框 4、点击确定,运行多变量分析过程。 结果解释 1、协方差矩阵等同性的Box检验结果,如图4 图4 协方差矩阵检验 结果说明:此Box检验的协方差矩阵为三位候选人每个人的支持者的年龄段和受教育程度的协方差矩阵。因为sig>0.05,所以差异不显著,即各个因变量的协方差矩阵在所有三个候选人组中是相等的。可以对其进行多元方差分析。 2、多变量检验结果,如图5

图5 多变量检验 结果说明:被投票人在四种统计方法中的sig均小于0.05,所以差异显著,即三组的总体均值有显著性差异 3、误差方差等同性的Levene检验结果,如图6 图6 Levene检验 结果说明:只考虑单个变量,年龄段或者受教育程度,每位候选人的20名支持者的随机误差是否有显著性差异。因为sig>0.05,差异不显著,所以三位候选人的20名支持者的随机误差相等。 可以进行单因素方差分析。 4、主体间效应的检验结果,如图7 图7 主体间效应的检验 结果说明:被投票人一行中,年龄段的sig<0.05,差异显著,即支持三位候选人的选民中,年龄段之间存在显著差异;而受教育程度的sig>0.05,差异不显著,即支持三位候选人的选民中,受教育程度差异不显著。

SPSS多因素方差分析报告

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

SPSS概览--数据分析实例详解

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

spss的数据分析报告

Gender Educational Level (years)N Valid 474474Missing 00关于某公司474名职工综合状况的统计分析报告 1、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工 资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。2、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析 能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女 性别分布进行频数分析,结果如下: Gender FrequencyPercent Valid Percent Cumulative Percent Valid Female 21645.645.645.6 Male 258 54.4 54.4 100.0 Total 474100.0100.0 上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表 : Educational Level (years) Valid Cumulative

SPSS-单因素方差分析(ANOVA)-案例解析资料讲解

SPSS- 单因素方差分析( ANOVA) - 案例解 析

SPSS单因素方差分析(ANOVA)案例解析 2011-08-30 11:10 这几天一直在忙电信网上营业厅用户体验优化改版事情,今天将我最近习SPSS单因素方差分析(ANOVA分析,今天希望跟大家交流和分享一下: 继续以上一期的样本为例,雌性老鼠和雄性老鼠,在注射毒素后,经过一段时间,观察鼠死亡和存活情况。 研究的问题是:老鼠在注射毒液后,死亡和存活情况,会不会跟性别有关? 样本数据如下所示:(a代表雄性老鼠b代表雌性老鼠0代表死亡1代表着tim 代表注射毒液后,经过多长时间,观察结果) 点击“分析”一一比较均值-------- 单因素AVOVA,如下所示:

从上图可以看出,只有“两个变量”可选,对于“组别(性别)”变量不可选, 进行“转换”对数据重新进行编码, 点击“转换”一“重新编码为不同变量”将a,b"分别用8,9进行替换,得到如下结果”这里可能需

此时的8代表a(雄性老鼠)9代表b雌性老鼠,我们将“生存结局”变量移入“因变量列表框内,将“性别”移入“因子”框内,点击“两两比较”按钮,如下所示:

“勾选“将定方差齐性”下面的项 点击继续 LSD选项,和“未假定方差齐性”下面的Tamhane's T2 选点击“选项”按钮,如下所示: I固疋和随枫效果(号 IN有建同備性檯验迥) 匚旦rown-Forsythe(B) El Welches} 姑朱値 ?按分析顺序排麒个案? 「I I S3 Affifi 勾选“描述性”和“方差同质检验”以及均值图等选项,得到如下结果:

spss多因素方差分析报告例子.doc

作业8:多因素方差分析 1,data0806-height是从三个样方中测量的八种草的高度,问高度在三个取样地点,以及八种草之间有无差异?具体怎么差异的? 打开spss软件,打开data0806-height数据,点击Analyze->General Linear Model->Univariate打开: 把plot和species送入Fixed Factor(s),把height送入Dependent Variable,点击Model打开:

选择Full factorial,Type III Sum of squares,Include intercept in model(即全部默认选项),点击Continue回到Univariate主对话框,对其他选项卡不做任何选择, 结果输出:

因无法计算MM M rror,即无法分开MM intercept 和MM error,无法检测interaction 的影响,无法进行方差分析, 重新Analyze->General Linear Model->Univariate打开:

选择好Dependent Variable和Fixed Factor(s),点击Model打开: 点击Custom,把主效应变量species和plot送入Model框,点击Continue回到Univariate 主对话框,点击Plots:

把date送入Horizontal Axis,把depth送入Separate Lines,点击Add,点击Continue 回到Univariate对话框,点击Options: 把OVERALL,species, plot送入Display Means for框,选择Compare main effects,Bonferroni,点击Continue回到Univariate对话框, 输出结果:

spss方差分析

一 实验目的 掌握单因素方差分析的原理与步骤、多因素方差分析的原理与步骤、协方差分析的原理与步骤。 二 实验内容 题目一:某农场为了比较4种不同品种的小麦产量的差异,选择土壤条件基本相同的土地,分成16块, 将每一个品种在4块试验田上试种,测得小表亩产量(kg )的数据如表6.17所示(数据文件为data6-4.sav ), 试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。(数据来源:《SPSS 实用统计分析》 郝黎仁,中国水利水电出版社) 表6.17 小麦产量的实测数据 实验结果截图:

实验结果分析: 根据不同小麦的平均产量在显著性水平0.05和0.01下的奇性检验结果、方差检验结果、多重比较结果、均值折线图可以看出,不管是方差还是均值,差异较大,而它的均值折线图分布比较陡峭。所以,不同小麦的平均产量有显著差异。 题目二:2. 某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表6.18(单位:千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?(数据来源:《统计学(第三版)》,M.R. 斯皮格尔,科学出版社) 表6.18 四种轮胎的寿命数据

实验结果截图:

实验结果分析: 由上述结果图可以看出,虽然奇性结果相伴概率等于0.05满足了方差检验的前提条件,在ANOV A图中,相伴概率也大于显著性水平,表示,四种轮胎中方差显著区别不大,但是,在多重比较结果图里,有4个组之间的相伴概率都小于显著性水平,而且,在各组均值的折线图里,我们也可以看出四组存在了显著性差异。所以四种不同类型轮胎的寿命间存在显著性差异。 题目三:将4种不同的水稻品种A1,A2,A3,A4安排在面积相同的4种不同土质的地块B1,B2,B3,B4中试种,测得各地块的产量(kg)如表6.19(数据文件为data6-6.sav),试分别在显著性水平为0.05和0.01下检验不同水稻品种、不同土质及二者交互作用对水稻产量的影响。(数据来源:《SPSS实用统计分析》郝黎仁,中国水利水电出版社) 表6.19 四种水稻的产量数据 实验结果截图: Between-Subjects Factors Value Label N 水稻 1 A1 4 2 A2 4 3 A3 4 4 A4 4 土地 1 B1 4 2 B2 4 3 B3 4 4 B4 4

【精品管理学】spss因子分析案例 共(13页)

[例11-1]下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。

图 ???对话框(图框。 图 钮返回 图11.3?描述性指标选择对话框 ???点击Extraction...钮,弹出FactorAnalysis:Extraction对话框(图11.4),系统提供如下因子提取方法: 图11.4?因子提取方法选择对话框 ???Principalcomponents:主成分分析法;

???Unweightedleastsquares:未加权最小平方法; ???Generalizedleastsquares:综合最小平方法; ???Maximumlikelihood:极大似然估计法; ???Principalaxisfactoring:主轴因子法; ???Alphafactoring:α因子法; ???对话框。 ???5种因图 ???旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击Continue钮返回FactorAnalysis对话框。 ???点击Scores...钮,弹出弹出FactorAnalysis:Scores对话框(图11.6),系统提供3种估计因子得分系数的方法,本例选Regression(回归因子得分),之后点击Continue钮返回FactorAnalysis对话框,再点击OK钮即完成分析。

图11.6?估计因子分方法对话框? ?11.2.3?结果解释 ??在输出结果窗口中将看到如下统计数据: ??系统首先输出各变量的均数(Mean)与标准差(StdDev),并显示共有25例观察单位进入分析;接着输出相关系数矩阵(CorrelationMatrix),经Bartlett检验表明:Bartlett值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 好。今KMO值 NumberofCases?=?????25 CorrelationMatrix: X1???????X2???????X3???????X4???????X5???????X6???????X7 X1????????1.00000 X2?????????.58026??1.00000

SPSS买房数据分析实施报告

《统计分析软件(双语)》 实验报告 题目:关于“某地区买房数据”的分析报告 姓名: 学号:1204100215 专业:统计学 院系:统计学院 指导教师: 完成日期:2014年12月10日

摘要 利用SPSS统计分析软件对“某地区买房”数据进行了描述性统计分析,比较均值,相关分析,回归分析四大类型的数据分析。其中在描述性统计分析中作了频数分析,探索分析,交叉分析,得出了该地区中年龄段在25~45居多,就业大多在国企,文化程度高中和大学所占比重大;大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历的居住面积。人均居住面积的单样本T检验的出了的结论是人均居住面积与均值之间存在显著性差异。现居住面积和人居住面积的双变量的相关分析得出了两者之间存在显著性差异。在回归分析中得出的结论是现居住面积是服从正态分布的且和满意度是显著相关的。

目录 一、数据简要 (3) 二、数据分析 (3) (一)描述分析性统计, (3) 1,就业状况的频数分析 (3) 2,文化程度的频数分析 (3) 3,现居住面积及人均居住面积的描述性分析 (3) 4,居住面积和文化程度的探索分析 (3) 5,文化程度与年收入的交叉列联表分析 (3) (二)均值比较 (3) 1,人均现住面积和年龄段的描述统计 (3) 2,人均居住面积的单样本T检验 (3) 3,现居住面积的独立样本T检验 (3) (三)相关分析 (3) 1,现居住面积和人居住面积的双变量的相关分析 (3) 2,人均居住面积,现居住面,居住类型的偏相关分析 (3) (四)回归分析 (3) 三、小结 (3)

一、数据简要 本次分析的数据为某年某地719个人买房情况统计表,一共有11个变量,其中现居住面积与人均居住面积为scale变量,其余9个变量为nonscale变量,依次为年龄段,文化程度,从业状况,家庭类型,家庭年收入,住房满意度,卖掉现房,购买户型,是否贷款。

相关文档
最新文档