spss实验报告
spss分析实验报告

spss分析实验报告SPSS分析实验报告引言在社会科学研究领域,SPSS(Statistical Package for the Social Sciences)作为一种数据分析工具,被广泛应用于统计分析和数据挖掘。
本实验报告旨在通过SPSS软件对某项研究进行数据分析,探索其背后的数据模式和相关关系。
一、研究背景与目的本次研究旨在探究大学生的学习成绩与睡眠时间之间的关系。
学习成绩和睡眠时间是大学生日常生活中两个重要的方面,通过分析两者之间的关联,可以为学生提供科学的学习指导,提高学习效果。
二、研究设计与数据收集本研究采用问卷调查的方式,通过随机抽样的方法选取了500名大学生作为研究对象。
问卷内容包括学生的学习成绩和每日平均睡眠时间。
收集到的数据以Excel表格的形式整理并导入SPSS软件进行分析。
三、数据预处理在进行数据分析之前,需要对数据进行预处理。
首先,检查数据是否存在缺失值或异常值。
通过SPSS软件的数据清洗功能,将缺失值进行填补或删除,确保数据的完整性和准确性。
其次,对数据进行标准化处理,以消除不同变量之间的量纲差异。
四、描述性统计分析描述性统计分析是对数据的基本特征进行总结和描述。
通过SPSS软件的统计功能,可以计算出学生的学习成绩和睡眠时间的平均值、标准差、最大值、最小值等统计指标。
同时,可以绘制直方图、箱线图等图表来展示数据的分布情况。
五、相关性分析相关性分析是研究不同变量之间相关关系的一种方法。
本研究中,我们使用Pearson相关系数来衡量学习成绩和睡眠时间之间的线性相关性。
通过SPSS软件的相关性分析功能,可以得到相关系数的数值和显著性水平。
如果相关系数接近于1或-1,并且显著性水平小于0.05,则说明学习成绩和睡眠时间之间存在显著的相关关系。
六、回归分析回归分析是研究自变量对因变量影响程度的一种方法。
在本研究中,我们使用线性回归模型来探究睡眠时间对学习成绩的影响。
通过SPSS软件的回归分析功能,可以得到回归方程的系数、显著性水平和模型的拟合优度。
spss实验报告,心得体会

spss实验报告,心得体会篇一:SPSS实验报告SPSS应用——实验报告班级:统计0801班学号:1304080116 姓名: 宋磊指导老师:胡朝明2010.9.8一、实验目的:1、熟悉SPSS操作系统,掌握数据管理界面的简单的操作;2、熟悉SPSS结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。
掌握常用统计图(线图、条图、饼图、散点、直方图等)的绘制方法;3、熟悉描述性统计图的绘制方法;4、熟悉描述性统计图的一般编辑方法。
掌握相关分析的操作,对显著性水平的基本简单判断。
二、实验要求:1、数据的录入,保存,读取,转化,增加,删除;数据集的合并,拆分,排序。
2、了解描述性统计的作用,并1掌握其SPSS的实现(频数,均值,标准差,中位数,众数,极差)。
3、应用SPSS生成表格和图形,并对表格和图形进行简单的编辑和分析。
4、应用SPSS做一些探索性分析(如方差分析,相关分析)。
三、实验内容:1、使用SPSS进行数据的录入,并保存: 职工基本情况数据:操作步骤如下:打开SPSS软件,然后在数据编辑窗口(Data View)中录入数据,此时变量名默认为var00001,var00002,…,var00007,然后在Variable View窗口中将变量名称更改即可。
具体结果如下图所示:输入后的数据为:将上述的数据进行保存:单击保存即可。
2、读取上述保存文件:选择菜单File--Open—Data;选择数据文件的类型,并输入文件名进行读取,出现如下窗口:选定职工基本情况.sav文件单击打开即可读取数据。
3、对上述数据新增一个变量工龄,其操作步骤为将当前数据单元确定在某变量上,选择菜单Data—Insert Variable,SPSS自动在当前数据单元所在列的前一列插入一2个空列,该列的变量名默认为var00016,数据类型为标准数值型,变量值均是系统缺失值,然后将数据填入修改。
结果如下图所示:篇二:SPSS相关分析实验报告本科教学实验报告(实验)课程名称:数据分析技术系列实验实验报告学生姓名:一、实验室名称:二、实验项目名称:相关分析三、实验原理相关关系是不完全确定的随机关系。
SPSS上机实验报告一

1.数据文件的建立。
打开SPSS,在数据编辑器的变量视图中,输入变量的属性特征,如Name,Width,Decinmal等。
以习题一为例,输入为下:返回数据编辑库,数据视图,直接录入数据。
习题一的数据表如下:点击Save,输入文件名将文件保存。
2.数据的整理数据编辑窗口的Date可提供数据整理功能。
其主要功能包括定义和编辑变量、观测量的命令,变量数据变换的命令,观测量数据整理的命令。
以习题一为例,将上图中的数据进行整理,以GDP值为参照,升序排列。
数据整理后的数据表为:整理后的数据,可以直观看出GDP值的排列。
3、频数分析。
以习题一为例(1).单击“分析→描述统计→频率”(2)打开“频率”对话框,选择GDP为变量(3)单击“统计量”按钮,打开“统计量”对话框.选择中值及中位数。
得到如下结果:(4)单击“分析→描述统计→探索”,打开“探索”对话框,选择GDP(亿元),输出为统计量。
结果如下:4、探索分析以习题2为例子:(1)单击“分析→统计描述→频率”,打开“频率”对话框,选择“身高”变量。
(2)选择统计量,分别选择百分数,均值,标准差,单击图标。
的如下结果:(3)单击“分析→统计描述→探索”,选择相应变量变量,单击“绘制”,选择如下图表,的如下结果:从上述图标可以看出,除了个别极端点以外,数据都围绕直线上下波动,可以看出,该组数据,在因子水平下符合正态分布。
4.交叉列联表分析:以习题3,原假设是吸烟与患病无关备择假设是吸烟与患病有关操作如下:单击“分析→统计描述→交叉表”,打开“交叉表”对话框,选择相应变量变量,单击精确,并选择“统计量”按钮,选择“卡方”作为统计量检验,然后单击“单元格”按钮,选择“观测值”和“期望值”进行计数。
得出分析结果如下:分析得出卡方值为7.469,,自由度是1,P值为0.004<0.05拒绝原假设,故有大于95%的把握认为吸烟和换慢性气管炎有关。
习题4:原假设是性别与安全性能的偏好无关备择假设是性别与安全性能的偏好有关操作如下:单击“分析→统计描述→交叉表”,打开“交叉表”对话框,选择相应行列变量然后选择“统计量”按钮,以“卡方”作为统计量检验.单击“单元格”按钮,选择“观测值”和“期望值”进行计数单击“确定”,得出分析结果如下:分析得出卡方值为19自由度是4,P值为0.001<0.05拒绝原假设,故有99.9%的把握认为性别与安全性能的偏好有关5实验作业补充。
SPSS实验报告完整版

SPSS实验实验课程专业统计软件应用上课时间学年学期周(年月日—日)学生姓名学号所在学院指导教师第五章第一题通过样本分析,结果如下图One-Sample StatisticsN Mean Std. Deviation Std. Error Mean 成绩27 77.9312.111 2.331One-Sample TestTest Value = 70t df Sig. (2-tailed)Mean Difference 95% Confidence Interval of theDifferenceLower Upper成绩 3.400 26.0027.926 3.13 12.72从图看出,sig=0.002,小于0.05,因此本班平均成绩与全国平均成绩70分有显著性差异。
第五章第二题通过独立样本分析,结果如下图Group Statistics成绩N Mean Std. Deviation Std. Error Mean成绩1=男10 84.0011.528 3.6450=女10 62.9018.454 5.836Independent Samples TestLevene's Test forEquality of Variances t-test for Equality of MeansF Sig. t dfSig.(2-tailed)MeanDifferenceStd. ErrorDifference95% Confidence Interval of theDifferenceLower Upper成绩Equalvariancesassumed1.607.221 3.06718.007 21.100 6.881 6.64435.556Independent Samples TestLevene's Test forEquality of Variances t-test for Equality of MeansF Sig. t dfSig.(2-tailed)MeanDifferenceStd. ErrorDifference95% Confidence Interval of theDifferenceLower Upper成绩Equalvariancesassumed1.607.221 3.06718.007 21.100 6.881 6.64435.556Equalvariancesnotassumed3.06715.096.008 21.100 6.881 6.44235.758在显著性水平为0.05的情况下,t统计量的概率p为0.007,故拒绝零假设,既两样本的均值不相等,既男女生成绩有显著性差异。
SPSS聚类分析实验报告

SPSS聚类分析实验报告一、实验目的本实验旨在通过SPSS软件对样本数据进行聚类分析,找出样本数据中的相似性,并将样本划分为不同的群体。
二、实验步骤1.数据准备:在SPSS软件中导入样本数据,并对数据进行处理,包括数据清洗、异常值处理等。
2.聚类分析设置:在SPSS软件中选择聚类分析方法,并设置分析参数,如距离度量方法、聚类方法、群体数量等。
3.聚类分析结果:根据分析结果,对样本数据进行聚类,并生成聚类结果。
4.结果解释:分析聚类结果,确定每个群体的特征,观察不同群体之间的差异性。
三、实验数据本实验使用了一个包含1000个样本的数据集,每个样本包含了5个变量,分别为年龄、性别、收入、教育水平和消费偏好。
下表展示了部分样本数据:样本编号,年龄,性别,收入,教育水平,消费偏好---------,------,------,------,---------,---------1,30,男,5000,大专,电子产品2,25,女,3000,本科,服装鞋包3,35,男,7000,硕士,食品饮料...,...,...,...,...,...四、实验结果1. 聚类分析设置:在SPSS软件中,我们选择了K-means聚类方法,并设置群体数量为3,距离度量方法为欧氏距离。
2.聚类结果:经过聚类分析后,我们将样本分为了3个群体,分别为群体1、群体2和群体3、每个群体的特征如下:-群体1:年龄偏年轻,女性居多,收入较低,教育水平集中在本科,消费偏好为服装鞋包。
-群体2:年龄跨度较大,男女比例均衡,收入中等,教育水平较高,消费偏好为电子产品。
-群体3:年龄偏高,男性居多,收入较高,教育水平较高,消费偏好为食品饮料。
3.结果解释:根据聚类结果,我们可以看到不同群体之间的差异性较大,每个群体都有明显的特征。
这些结果可以帮助企业更好地了解不同群体的消费习惯,为市场营销活动提供参考。
五、实验结论通过本次实验,我们成功地对样本数据进行了聚类分析,并得出了3个不同的群体。
spss实验报告---方差分析

实验报告——(方差分析)一、实验目的熟练使用SPSS软件进行方差分析。
学会通过方差分析分析不同水平的控制变量是否对结果产生显著影响。
二、实验内容1、某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?(自建数据集)石棉肺患者可疑患者非患者1.82.3 2.91.42.13.21.52.1 2.72.1 2.1 2.81.92.6 2.71.72.53.01.82.33.41.92.43.01.82.43.41.8 3.32.03.5SPSS计算结果:在建立数据集时定义group1为石棉肺患者,group2为可疑患者,group3为非患者。
零假设:各水平下总体方差没有显著差异。
相伴概率为0.075,大于0.05,可以认为各个组的方差是相等的,可以进行方差检验。
从上表可以看出3个组之间的相伴概率都小于显著性水平0.05,拒绝零假设,说明3个组之间都存在显著差别。
2、某汽车经销商在不同城市进行调查汽车的销售量数据分析工作,每个城市分别处于不同的区域:东部、西部和中部,而且汽车经销商在不同城市投放不同类型的广告,调查数据放置于附件中数据文件“汽车销量调查.sav”。
(1)试分析不同区域与不同广告类型是否对汽车的销量产生显著性的影响?(2)如果考虑到不同城市人均收入具有差异度时,再思考不同区域和不同广告类型对汽车销量产生的影响差异是否改变,这说明什么问题?SPSS计算结果:(1)此为多因素方差分析相伴概率为0.054大于0.05,可以认为各个组总体方差相等可以进行方差检验。
不同地区贡献的离差平方和为7149.781,均方为3574.891;不同广告贡献的离差平方和为7625.708,均方为3812.854。
说明不同广告和不同地区对汽车销量都有显著性影响。
广告对于销量的影响略大于地区对销量的影响。
从地区这个变量比较:第一组和第三组的相伴概率为0.000,低于显著性水平,一、三组均值差异显著;第二组和第三组的相伴概率为0.028,低于显著性水平,二、三组均值差异显著。
SPSS聚类分析实验报告

SPSS聚类分析实验报告摘要:本实验旨在利用SPSS软件进行聚类分析,并通过实验结果分析数据的分布情况,揭示数据中的隐含规律。
通过聚类分析,我们将数据样本划分为不同的类别,以便更好地理解数据的特征、相似性以及群组之间的差异。
实验结果表明,SPSS软件在聚类分析方面具有较高的可靠性和准确性,能够有效地提取数据的特征和隐含信息,为数据分析提供有力支持。
1.引言2.实验方法2.1数据收集与准备本实验使用到的数据集是从公开渠道获取的一份包含各个地区收入、消费、教育等特征的数据集。
为了保护数据安全和隐私,将被分析的数据进行了匿名化处理。
2.2SPSS操作步骤(1)导入数据集:将数据集导入SPSS软件,并进行数据检查和处理,确保数据的完整性和准确性。
(2)选择合适的聚类算法:根据实验目的和数据特点选择适合的聚类算法,这里选择了k-means算法作为聚类算法。
(3)设置聚类参数:设置聚类的类别数、迭代次数等参数,以得到最优的聚类结果。
(4)进行聚类分析:运行聚类分析模块,观察聚类结果和聚类中心的分布情况。
(5)结果解释与分析:根据聚类结果,对不同类别的数据进行特征分析和差异比较,以更好地理解数据的特点和分布规律。
3.实验结果与分析通过SPSS软件进行聚类分析,得到了数据样本的聚类结果。
根据平均轮廓系数和间隔分析等指标,确定了最优的聚类类别数,并得到了每个类别的聚类中心和分布情况。
3.1聚类类别数的确定为了确定合适的聚类类别数,使用平均轮廓系数方法和间隔分析方法进行评估。
通过计算不同聚类类别数下的平均轮廓系数和间隔分析值,选择具有最大平均轮廓系数和最小间隔分析值的类别数作为最优的聚类类别数。
经过计算分析,确定了聚类类别数为33.2聚类结果与分析根据聚类类别数为3的聚类结果,将数据样本分为了三组。
分别对每组数据进行了特征分析和差异比较。
3.2.1类别1:高收入、高教育水平、低消费该类别的个体具有较高的收入水平和教育水平,但消费水平较低。
spss对数据进行相关性分析实验报告

spss对数据进行相关性分析实验报告SPSS数据相关性分析实验报告一、引言数据相关性分析是一种用统计方法来研究变量之间关系的方法。
SPSS作为一种常用的统计软件,具有丰富的功能和灵活性,能够对数据进行多角度的分析和解读。
本报告旨在利用SPSS对一组样本数据进行相关性分析,并通过报告的形式详细介绍分析的步骤和结果。
二、实验设计和数据采集本次实验选取了一个包括X变量和Y变量的数据集,通过观察这两个变量之间的相关关系,探究它们之间是否存在一定的线性关系。
三、数据清洗与统计描述在进行相关性分析之前,需要对数据进行清洗和统计描述。
首先,通过观察数据的分布情况,检查是否存在异常值。
如果出现异常值,可以采取删除或者替换的方式进行处理。
其次,计算数据的均值、标准差、最大值、最小值等统计指标,了解数据的基本特征。
四、Pearson相关系数分析Pearson相关系数是一种常用的衡量两个变量之间的相关性的方法。
它的取值范围在-1到1之间,接近于1表示正相关,接近于-1表示负相关,接近于0则表示无相关性。
在SPSS中,进行Pearson相关系数分析非常简便。
五、Spearman相关系数分析Spearman相关系数是一种非参数检验方法,用于观察变量之间的单调关系。
相比于Pearson相关系数,它对于异常值的鲁棒性更强。
在SPSS中,可以选择Spearman相关系数分析来研究数据集中的变量之间的关系。
六、结果分析与讨论经过Pearson相关系数和Spearman相关系数的分析,我们得出如下结论:X变量与Y变量之间存在显著的正相关关系。
通过相关系数的计算,结果显示相关系数为0.8,说明二者之间具有较强的线性相关性。
这一结果与我们的研究假设相吻合,证明了X变量对Y变量的影响。
七、实验结论通过SPSS对数据进行相关性分析,我们得出结论:X变量与Y变量之间存在显著的正相关关系。
这一结论进一步加深了对于变量之间关系的理解,为后续的研究提供了参考。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专业统计软件应用实验报告第五章思考与练习3.表5.20 是某班级学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70 分之间是否有显著性差异(数据文件:data5-16.sav)。
解:解决问题的原理:独立T样本检验提出原假设和备择假设:Ho:p<0.05,该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性;H1:p>0.05,该班的数学成绩与全国的平均成绩70 分之间存在显著相关性。
第1步单样本T 检验分析设置(1)选择菜单:“分析”→“比较均值”→“单样本T 检验(S)”,打开“单样本T 检验主对话框”,确定要进行T 检验的变量并输入检验值,按如图所示进行设置。
将“成绩”选入“检验变量”中,输入待检验的值“70”,用来检验产生的样本均值与检验值有无显著性差异。
第2步“选项”对话框设置:指定置信水平和缺失值的处理方法。
第3步主要结果及分析完成以上的操作步骤后,点击“确定”按钮,运行结果如下所示,具体分析如下:下表给出了单样本T 检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误差。
当置信水平为95%时,显著性水平为0.05,从表5.2 中可以看出,双尾检测概率P 值为0.002,小于0.05,故接受原假设,也就是说该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性,即班的数学成绩与全国的平均成绩70 分之间存在显著性差异。
4. 在某次测试中,随机抽取男女同学的成绩各10 名,数据如下:男:99 79 59 89 79 89 99 82 80 85女:88 54 56 23 75 65 73 50 80 65假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异(数据文件:data5-17.sav)。
解:解决问题的原理:独立样本T检验提出假设和备择假设:Ho:p<0.05,男女生的成绩没有显著相关性。
H1 p>0.05,男女生的成绩有显著性相关。
第1 步数据组织根据表题目,在SPSS 数据文件中建立两个变量,分别为“性别”、“成绩”,度量标准分别为“名义”及“度量”,变量“品种”的变量值标签为:1-男,2-女,录入数据后,保存名为data5-17.sav 的SPSS 数据文件。
第2 步独立样本T 检验设置菜单选择:“选择”→“比较均值”→“独立样本T 检验”,打开“独立样本T 检验”主对话框,确定要进行T 检验的变量,确定分组变量。
“定义组”按钮:定义变量的分组,分别是“1”、“2”。
如下图所示:按如图所示进行设置。
(2)“选项”对话框设置:指定置信水平和缺失值的处理方法。
如下图所示:第3 步运行结果及分析完成以上的操作步骤后,点击“确定”按钮,运行结果下表所示,具体意义分析如下:(1)下表是本例的独立样本T 检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误差。
(2)表中第二列是F 统计量的值,为1.6074,第三列是对应的概率p 值,为0.221。
显著性水平为0.05,由于概率p 值大于0.05,可以认为两个总体的方差无显著性差异,即方差具备齐性。
在方差相等的情况下,独立样本T 检验的结果应该看表中的“假设方差相等”一行,第5 列为相应的双尾检测概率(Sig.(双侧))为0.007,在显著性水平为0.05 的情况下,T 统计量的概率p 值小于0.05,故应接受原假设,即认为两样本没有显著相关性,两均值是不相等的,即认为男女生的成绩有显著性差异。
5.某医疗机构为研究某种减肥药的疗效,对16 位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重,数据如表5.21 所示。
假设体重近似服从正态分布,试分析服药前后,体重是否有显著变化(数据文件:data5-18.sav)。
解:解决问题的原理:配对样本T检验提出假设和备择假设:Ho:p>0.05,服药前后体重有显著相关性。
H1:p<0.05,服药前后体重没有显著相关性。
第1 步数据组织首先建立SPSS 数据文件,建立两个变量:“服药前”、“服药后”,录入相应数据,保存为data5-18.sav。
第2 步配对样本T 检验设置(1)选择菜单:“分析→比较均值→配对样本T 检验”对话框,,确定要配对分析的变量,按如图下图所示进行设置。
“选项”对话框设置:设置置信水平和缺失值的处理方法。
第3 步运行结果及分析点击“确定”按钮,运行结果如下表所示,具体意义分析如下:(1)下表是成对样本的基本描述性统计量,包括每一个样本的的均值、样本容量、标准差和均值标准误差。
从两对样本的均值变化可以看出,均值都有一定量的变化,但是否存在显著性差异,还必须通过计算相应的t 统计量。
(2)下表是两配对样本T 检验的简单相关关系及其检验结果。
表中第3 列为训练前和训练后两样本的相关系数,第4 列是相关系数的检验p 值。
从表中可以看出,在显著性水平为0.05 时,概率p 值为0。
000,小于0.05,拒绝原假设,不可以认为服药前后的体重没有明显的线性关系。
(3)下表是两配对样本T 检验的最终结果。
训练前后的配对样本的平均差值为8.063,差值的标准差为2.886,差值的均值标准误差为0.722,置信度为95%时差值的置信下限和置信上限共同构成了该差值的置信区间为(6.525,9.600),统计量的观测值t 为11.175,自由度df 为15,sig.(双侧)为双尾检验概率p 值,在显著性水平为0.05 时,由于概率p 值为0.000,小于0.05,拒绝原假设,说明服药前后体重没有显著相关性,可以认为服药前后的体重有显著变化。
6.某地一周内各日忧郁症的人数分布如表5.22 所示,请在显著性水平0.05 下检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1 的分布。
(数据文件:data5-19.sav)解:解决问题的原理:卡方检验提出原假设和备择假设:Ho:P>0.05,一周内各日人们忧郁数满足1:1:2:2:1:1:1 的分布;H1:P<0.05,一周内各日人们忧郁数不满足1:1:2:2:1:1:1 的分布第1步数据组织首先建立SPSS 数据文件,建立两个变量:“weekday”、“persons”,录入相应数据,保存为data5-19.sav。
“工作日”字段的度量标准为“序号”或“名义”的字符或数值类型,“次品数”字段的度量标准为“度量”的数值类型.第2步“次品数”字段加权处理通过分析“weekday”、“persons”两个字段的含义及度量标准,确定“weekday”为被分析字段,而“persons”表示各工作日出现的频率,所以应该对“次品数”进行加权处理。
执行“数据”→“加权个案”,打开“加权个案”对话框,按图所示进行设置。
第4 步单因素的非参数检验设置选择菜单“分析→非参数检验→单样本”,按下面步骤进行设置:(1)“目标”选项页选择“自定义分析”。
(2)“字段”选项页中选择使用定制字段分配,并将“weekday”字段选人“检验字段”。
(3)“设置”选项页中选择“自定义检验”,并选中“比较观察可能性和假设可能性(卡方检验)”,“检验选项”及“用户缺失值”保持默认选项。
第5 步卡方检验的选项设置单击“卡方检验”对应的“选项”按钮,打开“卡方检验选项”对话框,按如图所示进行设置。
第6 步运行结果及分析完成以上的操作步骤后,点击“运行”按钮,运行结果如图所示,具体意义分析如下:为单样本卡方检验的假设检验结果,根据前面设置,给出了卡方检验的原假设为“工作日的类别以1:1:2:2:1:1:1的概率发生”,其相伴概率值Sig. =0.331>0.05,说明不应拒绝原假设,因此图的“决策者”给出“保留原假设”的决策,认为工作日的类别是以1:1:2:2:1:1:1的概率发生的,双击输出文件中的如图5-12 的“假设检验汇总”表,打开下图所示图形,从图可以更直观的看出周一到周日的人数的分布情况,且从中可以看出共有303 个样本,检验统计量为6891,渐进显著性(即P 值)为0.331。
第六章思考与练习5.为了寻求适应某地区的高产油菜品种,今选了5 种不同品种进行试验,每一品种在4 块条件完全相同的试验田上试种,其他施肥等田间管理措施完全一样。
表6.20 所示为每一品种下每一块田的亩产量,根据这些数据分析不同品种的油菜的平均产量在显著性水平0.05 下有无显著性差异。
(数据文件:data6-7.sav)解:解决问题的原理:单因素方差分析提出原假设和备择假设:Ho:P>0.05,不同品种的油菜的平均产量有显著相关性;H1:P<0.05,不同品种的油菜的平均产量没有显著相关性。
第1步数据的组织数据分成两列,一列是品种,另一变量是产量(变量值分别为1,2,3,4,5),输入数据并保存。
第2步方差相等的齐性检验选择菜单:“分析→均值比较→单因素ANOVA”,打开如图所示单因素方差分析对话框。
(1)选项按钮:选项”对话框,本例选择“方差同质性检验”。
(2)均值图复选框:选中该复选框,表示输出均数分布图,根据因素变量值所确定的各组均数描绘出因变量的均值分布情况。
(3)缺失值处理选项组:选择缺失值的处置方式。
第4步:结果分析设置好选项后,运行结果如下:方差齐性检验的H0 假设是:方差相等。
从表可看出相伴概率Sig.=0.164>0.05说明应该接受H0 假设(即方差相等)。
故下面就用方差相等的检验方法。
由于组间比较的相伴概率Sig.(p 值)=0.016<0.05,故应拒绝H0 假设(几种油菜平均产量有显著相关性),说明几种油菜平均产量没有显著差异。
6.某公司希望检测四种类型的轮胎A,B,C,D 的寿命(由行驶的里程数决定),见表6.21(单位:千英里),其中每种轮胎应用在随机选择的6 辆汽车上。
在显著性水平0.05 下判断不同类型轮胎的寿命间是否存在显著性差异?(数据文件:data6-8.sav)解:解决问题的原理:多因素方差分析法提出原假设和备择假设:Ho:>0.05,四类型轮胎的寿命间显著相关;H1:P<0.05,四类型轮胎的寿命间不显著相关。
第1 步数据的组织数据分成两列,一列是轮胎的里程,变量名为“mileage”,另一变量是轮胎类型(变量值分别为1,2,3,4),变量名为“tyre”,并将标签设成对应的中文名称,输入数据并保存。
第2步方差相等的齐性检验选择菜单:“分析→均值比较→单因素ANOVA”,打开如图所示单因素方差分析对话框。
(2)选项按钮:选项”对话框,本例选择“方差同质性检验”。
(2)均值图复选框:选中该复选框,表示输出均数分布图,根据因素变量值所确定的各组均数描绘出因变量的均值分布情况。