SPSS实验报告
SPSS数据文件的建立和管理实验报告

第二题:
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示
2.在Data View中根据题目输入相关数据,结果如下图所示
3.对这个表格进行保存,并且命名为“减肥产品.sav”
3.选中“Match cases on key variables in sorted files”,将“学号”放入“Key Variables”中,结果如下所示
第二题:
因为题中要求将数据文件转换为EXCEL文件,所以通过【File】→【Save As】可实现
输入文件名“减肥产品”,再修改保存类型,选择EXCEL保存类型,即可得到升序排列,结果如下图所示
3.对第一个表格进行保存,并且命名为“学生成绩一.sav”
4.重新打开一个表格,在Variable View中根据题中要求输入数据,如下图所示
5.在Data View中先输入数据,再选中“学号”一列,选择升序排列,结果如下图所示
表1学生语文成绩
学号
1
3
4
5
8
9
10
2
6
7
姓名
张三
李四
王燕
赵宇
白艳
王洁
李丽
成功
孙昌
章建
语文成绩
89
76
87
65
97
74
82
90
67
88
表2学生数学成绩
学号
1
2
3
8
9
7
6
5
4
10
姓名
张三
成功
spss实验报告

专业统计软件应用实验报告第五章思考与练习3.表5.20 是某班级学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70 分之间是否有显著性差异(数据文件:data5-16.sav)。
解:解决问题的原理:独立T样本检验提出原假设和备择假设:Ho:p<0.05,该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性;H1:p>0.05,该班的数学成绩与全国的平均成绩70 分之间存在显著相关性。
第1步单样本T 检验分析设置(1)选择菜单:“分析”→“比较均值”→“单样本T 检验(S)”,打开“单样本T 检验主对话框”,确定要进行T 检验的变量并输入检验值,按如图所示进行设置。
将“成绩”选入“检验变量”中,输入待检验的值“70”,用来检验产生的样本均值与检验值有无显著性差异。
第2步“选项”对话框设置:指定置信水平和缺失值的处理方法。
第3步主要结果及分析完成以上的操作步骤后,点击“确定”按钮,运行结果如下所示,具体分析如下:下表给出了单样本T 检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误差。
当置信水平为95%时,显著性水平为0.05,从表5.2 中可以看出,双尾检测概率P 值为0.002,小于0.05,故接受原假设,也就是说该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性,即班的数学成绩与全国的平均成绩70 分之间存在显著性差异。
4. 在某次测试中,随机抽取男女同学的成绩各10 名,数据如下:男:99 79 59 89 79 89 99 82 80 85女:88 54 56 23 75 65 73 50 80 65假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异(数据文件:data5-17.sav)。
解:解决问题的原理:独立样本T检验提出假设和备择假设:Ho:p<0.05,男女生的成绩没有显著相关性。
H1 p>0.05,男女生的成绩有显著性相关。
SPSS实验报告

重庆邮电大学课程报告2016 - 2017 学年第2 学期课程名称:《数据分析方法与实训》姓名:XX学号:*******XXX班级:0104150X专业:信息工程指导教师:**2017年7 月2 日(1)基于前述操作,继续在myzy.sav中完成以下任务:①分别绘制语文、数学、外语成绩的箱体图,并对箱体图的输出结果进行解释。
②分别绘制语文、数学、外语成绩的茎叶图,并对茎叶图的输出结果进行解释。
③分别绘制语文、数学、外语成绩的Q-Q图,并对Q-Q图的输出结果进行解释。
箱体图操作方法:1)在SPSS中打开yyyy.sav,处于“数据视图”状态。
2)利用【分析】——【描述统计】——【探索】命令。
3)变量“数学”从左侧列表移到右侧的“因变量列表”中;4)变量“姓名”从左侧列表移到右侧“标注个案”中;5)在“探索”对话框中,单击右侧【绘制】;6)在“探索.图”对话框中,从左上角的“箱图”选中【不分组】,“描述性”选中【茎叶图】,单击【继续】,【确定】。
操作结果:图1.1关于语文的数据分析图1.2关于语文的箱体图输出结果分析:矩形中部的横线表明,语文的中位数为84.50。
箱体部分对应四分位间距,箱体外无数据说明分值较为集中,无异常值(异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值)图1.3关于数学的数据分析图1.4关于数学的箱体图输出结果分析:矩形中部的横线表明,语文的中位数为82.00。
距离箱体很远的被标记“*”号的为极端值,“张一81”、“张一79”等为极端值。
图1.5关于外语的数据分析图1.6关于外语的箱体图输出结果分析:矩形中部的横线表明,语文的中位数为825.00。
距离箱体很远的被标记“*”号的为极端值,“张一75”、“张一73”等为极端值。
观测值位于触手之外但3倍箱体之内的个案位奇异值,标记为“o”,“张一71”、“张一17”为奇异值。
三个科目的茎叶图如下:图1.7语文图1.8数学图1.9外语输出结果分析:“Frequency”:频数,“Stem”:茎,“Leaf”:叶子。
spss实验报告---方差分析

实验报告——(方差分析)一、实验目的熟练使用SPSS软件进行方差分析。
学会通过方差分析分析不同水平的控制变量是否对结果产生显著影响。
二、实验内容1、某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?(自建数据集)石棉肺患者可疑患者非患者1.82.3 2.91.42.13.21.52.1 2.72.1 2.1 2.81.92.6 2.71.72.53.01.82.33.41.92.43.01.82.43.41.8 3.32.03.5SPSS计算结果:在建立数据集时定义group1为石棉肺患者,group2为可疑患者,group3为非患者。
零假设:各水平下总体方差没有显著差异。
相伴概率为0.075,大于0.05,可以认为各个组的方差是相等的,可以进行方差检验。
从上表可以看出3个组之间的相伴概率都小于显著性水平0.05,拒绝零假设,说明3个组之间都存在显著差别。
2、某汽车经销商在不同城市进行调查汽车的销售量数据分析工作,每个城市分别处于不同的区域:东部、西部和中部,而且汽车经销商在不同城市投放不同类型的广告,调查数据放置于附件中数据文件“汽车销量调查.sav”。
(1)试分析不同区域与不同广告类型是否对汽车的销量产生显著性的影响?(2)如果考虑到不同城市人均收入具有差异度时,再思考不同区域和不同广告类型对汽车销量产生的影响差异是否改变,这说明什么问题?SPSS计算结果:(1)此为多因素方差分析相伴概率为0.054大于0.05,可以认为各个组总体方差相等可以进行方差检验。
不同地区贡献的离差平方和为7149.781,均方为3574.891;不同广告贡献的离差平方和为7625.708,均方为3812.854。
说明不同广告和不同地区对汽车销量都有显著性影响。
广告对于销量的影响略大于地区对销量的影响。
从地区这个变量比较:第一组和第三组的相伴概率为0.000,低于显著性水平,一、三组均值差异显著;第二组和第三组的相伴概率为0.028,低于显著性水平,二、三组均值差异显著。
spss实验报告格式

spss实验报告格式篇一:spss实验报告模板实验报告实验三连续变量的统计描述与参数估计实验目的:1.了解连续变量的统计描述指标体系和参数估计指标体系。
2.掌握具体案例的统计描述和分析。
3.学会bootstrap等方法。
实验原理:1、spss的许多模块均可完成统计描述的任务。
2、spss有专门用于连续变量统计描述的过程。
3、spss可以进行频率等数据分析。
实验内容:1根据ccSS数据,分析受访者的年龄分布情况,分城市/合并描述,并给出简要结果分析。
2对ccSS中的总指数、现状指数和预期指数进行标准正态变换,对变换后的变量进行统计描述,并给出简要说明。
3根据ccSS数据,分城市对现状指数的均数和标准差进行Bootstrap 方法的参数点估计和区间估计,并同时与传统方法计算出的均值95%置信区间进行比较,给出简要结果分析。
4根据ccSS项目数据,对职业和婚姻状况进行统计描述,并进行简要说明。
5根据ccSS项目数据,对职业和家庭月收入情况的关系进行统计描述,并进行行列百分比的汇总,对结果进行简要说明。
6根据ccSS项目数据,给出变量a3a各选项的频数分布情况,并分析每个选项的应答人次和应答人数百分比。
7根据ccSS项目数据,分城市考察a3a各选项的频数分布情况,并给出简要分析。
实验步骤:(1)在分析菜单中点击描述统计,打开对话框“探索”。
把“S3年龄”添加到“因变量列表”,把“S0城市”添加到“因子列表”,把“id”添加到“标注个案”,点击“确定”。
(2)在分析菜单中点击描述统计,打开对话框“描述性”。
把总指数[index1]、现状指数[index1a]和预期指数[index1b]添加到“变量”框中,选中下方的“将标准化得分另存为变量(z)”,点击“确定”。
(3)同(2),打开对话框“描述性”,把“现状指数[index1a]”添加到“变量”框中,打开对话框“Bootstrap”,选择“执行”“水平”框中填95,选择“分层”,把“S0城市”添加到“分层变量”中,点击“继续”,点击“确定”。
主成分分析、因子分析实验报告--SPSS

主成分分析、因子分析实验报告--SPSS主成分分析、因子分析实验报告SPSS一、实验目的主成分分析(Principal Component Analysis,PCA)和因子分析(Factor Analysis,FA)是多元统计分析中常用的两种方法,旨在简化数据结构、提取主要信息和解释变量之间的关系。
本次实验的目的是通过使用 SPSS 软件对给定的数据集进行主成分分析和因子分析,深入理解这两种方法的原理和应用,并比较它们的结果和差异。
二、实验原理(一)主成分分析主成分分析是一种通过线性变换将多个相关变量转换为一组较少的不相关综合变量(即主成分)的方法。
这些主成分是原始变量的线性组合,且按照方差递减的顺序排列。
主成分分析的主要目标是在保留尽可能多的数据信息的前提下,减少变量的数量,从而简化数据分析和解释。
(二)因子分析因子分析则是一种探索潜在结构的方法,它假设观测变量是由少数几个不可观测的公共因子和特殊因子线性组合而成。
公共因子解释了变量之间的相关性,而特殊因子则代表了每个变量特有的部分。
因子分析的目的是找出这些公共因子,并估计它们对观测变量的影响程度。
三、实验数据本次实验使用了一份包含多个变量的数据集,这些变量涵盖了不同的领域和特征。
数据集中的变量包括具体变量 1、具体变量 2、具体变量 3等,共X个观测样本。
四、实验步骤(一)主成分分析1、打开 SPSS 软件,导入数据集。
2、选择“分析”>“降维”>“主成分分析”。
3、将需要分析的变量选入“变量”框。
4、在“抽取”选项中,选择主成分的提取方法,如基于特征值大于1 或指定提取的主成分个数。
5、点击“确定”,运行主成分分析。
(二)因子分析1、同样在 SPSS 中,选择“分析”>“降维”>“因子分析”。
2、选入变量。
3、在“描述”选项中,选择相关统计量,如 KMO 检验和巴特利特球形检验。
4、在“抽取”选项中,选择因子提取方法,如主成分法或主轴因子法。
最新《SPSS统计软件应用》实验报告册
《SPSS统计软件应用》实验报告册20 15 - 20 16 学年第 1 学期班级: T1353-3 学号: 20130530305 姓名:徐云授课教师:薛昌春实验教师:薛昌春实验学时:一周实验组号:目录1.实验一 SPSS的数据管理2.实验二描述性统计分析3.实验三均值检验4.实验四相关分析5.实验五因子分析6.实验六聚类分析7.实验七回归分析8.实验八判别分析实验一 SPSS的数据管理一、实验目的1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;2.掌握SPSS的数据管理功能。
二、实验内容:1、定义spss数据结构。
下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。
练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。
实验步骤:(1)打开SPSS 软件,新建一张date数据表;(2)打开 variable view 界面,对相应的变量数据进行属性设置;(3)打开 date view界面,输入数据,点击保存;实验结果及分析:略2 、高校提前录取名单的确定某高校今年对部分考生采取单独出题、提前录取的招生模式。
现有20名来自国内不同省市的考生报考该校,7个录取名额。
见数据文件compute.sav. 该校制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。
文化课成绩制定最低录取分数线:400分。
(2)个人档案中若有“不良记录”,不予录取。
(3)对西部考生和少数民族考生,给予加分优惠。
少数民族考生加20分,西部考生加10分。
(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。
(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。
练习:利用spss软件,综合利用所学,给出成绩排名的操作步骤。
实验步骤:(1)打开给的原数据文件;(2)执行 date/select case 命令,打开select case对话框,选择 if condiction is satisfatied ,输入“(数学 + 语文 + 英语 + 综合) >= 400 and 不良记录 = 0”,点击continue。
SPSS回归分析实验报告
中国计量学院现代科技学院实验报告实验课程:应用统计学实验名称:回归分析班级:学号:姓名:实验日期: 2012.05.23 实验成绩:指导教师签名:一.实验目的一元线性回归简单地说是涉及一个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。
本实验要求掌握一元线性回归的求解和多元线性回归理论与方法。
二.实验环境中国计量学院现代科技学院机房310三.实验步骤与内容1打开应用统计学实验指导书,新建excel表地区供水管道长度(公里)全年供水总量(万平方米)北京15896 128823 天津6822 64537 河北10771.2 160132 山西5669.3 77525 内蒙古5635.5 59276 辽宁21999 280510 吉林6384.9 159570 黑龙江9065.9 153387 上海22098.8 308309 江苏36632.4 380395 浙江24126.9 235535 安徽7389.4 204128 福建6270.4 118512 江西5094.7 143240 山东26073.9 259782 河南11405.6 185092 湖北15668.6 257787 湖南9341.8 262691 广东35728.8 568949 广西6923.1 134412 海南1726.7 20241 重庆6082.7 71077 四川12251.3 165632 贵州3275.3 45198 云南5208.5 52742 西藏364.9 5363陕西4270 73580甘肃5010 62127青海893 14390宁夏1538.2 22921新疆3670.2 766852.打开SPSS,将数据导入3.打开分析,选择回归分析再选择线性因变量选全年供水总量,自变量选供水管道长度统计里回归系数选估计,再选择模型拟合按继续再按确定会出来分析的结果对以上结果进行分析:(1)回归方程为:y=28484.712+11.610X(X是自变量供水管道长度,Y是因变量全年供水总量)(2)检验1)拟合效果检验根据表2可知,R2=0.819,即拟合效果好,线性成立。
实验报告四.spss一元线性相关回归分析预测
实验报告四.spss一元线性相关回归分析预测
本实验使用spss 17.0软件,针对50个被试者,使用一元线性相关回归分析预测变
量X和Y的关系。
一、实验目的
通过一元线性相关回归分析,预测50个被试者的被试变量X(会计实操次数)和被试变量Y(综合评价分)之间的关系,来检验变量X是否能够预测变量Y的值。
二、实验流程
(2)数据收集:通过收集50个被试者的实际实操次数与综合评价分,建立反映这两
者之间关系的一元线性回归方程。
(3)数据分析:通过SPSS软件的一元线性相关回归分析预测变量X和Y的关系,使
用R方值进行检验研究结果的显著性。
以分析变量X对于变量Y的影响程度。
三、实验结果及分析
1.回归分析结果如下所示:变量X的系数b = 0.6755,t = 7.561,p = 0.000,说
明变量X和被试变量Y之间存在着显著的相关关系;R方值为0.941,说明变量X可以较
好地预测变量Y。
2.可以得出一元线性回归方程为:Y=0.67×X+5.293,其中,b为系数,X是自变量,Y是因变量。
四、结论
(1)50个被试者实际实操次数与综合评价分之间存在着显著的相关性;
(2)变量X可以较好地预测变量Y,R方值较高;。
spss实验报告
《统计实习》SPSS实验报告姓名:学号:班级:会计二班实验报告二实验项目:描述性统计分析实验目的:1、掌握数据集中趋势和离中趋势的分析方法;2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别..实验内容及步骤一、数据输入案例:对6名男生和6名女生的肺活量的统计;数据如下:1.打开SPSS软件;进行数据输入:通过打开数据的方式对XLS的数据进行输入其变量视图为:二、探索分析进行探索分析得出如下输出结果:浏览由上表可以看出;6例均为有效值;没有记录缺失值得情况..由上表可以看出;男女之间肺活量的差异;男生明显优于女生;范围更广;偏度大.. 男男 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 342.00 1 . 892.00 2 . 02Stem width: 1000Each leaf: 1 cases女女 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 233.00 1 . 568 1.00 2 . 0Stem width: 1000Each leaf: 1 cases三、频率分析进行频率分析得出如下输出结果:由上图可知;分析变量名:肺活量..可见样本量N为6例;缺失值0例; 1500以下的33%;1500-2000男生33%女生50%;2000以上女生16.7%;男生33%..四、描述分析进行描述分析得出如下输出结果:由上图可知;分析变量名:工资;可见样本量N为6例;极小值为男1342女1213;极大值为男2200女2077;说明12人中肺活量最少的为女生是1213;最多的为男生有2200;均值为1810.50/1621.33;.标准差为327.735/325.408;离散程度不算大..五、交叉分析实验报告三实验项目:均值比较实验目的:.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验..实验内容及步骤(一)描述统计案例:某医疗机构为研究某种减肥药的疗效;对15位肥胖者进行为期半年的观察测试;测试指标为使用该药之前和之后的体重..编号 1 2 3 4 5服药前198 237 233 179 219服药后192 225 226 172 214编号 6 7 8 9 10服药前169 222 167 199 233服药后161 210 161 193 226编号11 12 13 14 15服药前179 158 157 216 257服药后173 154 143 206 249输入SPSS建立数据..由上图可知;结果输出均值、样本量和标准差..因为选择了分组变量;所以三项指标均给出分组及合计值;可见以这种方式列出统计量可以非常直观的进行各组间的比较..由上表可知;在显著性水平为0.05时;服药前后的概率p值为小于0.05;拒绝零假设;说明服药前后的体重有显著性变化(二)单样本T检验进行单样本T检验分析得出如下输出结果:由上表可以知;单个样本统计量分析表;的基本情况描述;有样本量、均值、标准差和标准误;单样本t检验表;第一行注明了用于比较的已知总体均值为14;从左到右依次为t值t、自由度df、P值Sig.2-tailed、两均值的差值Mean Difference、差值的95%可信区间..由上表可知:t=34.215;P=0.000<0.05..因此可以认为肺气肿的总体均值不等于0.(三)双样本T检验案例:研究某安慰剂对肥胖病人治疗作用;用20名患者分组配对;测得体重如下表;要求测定该安慰剂对人的体重作用是否比药物好..进行双样本T检验得出如下输出结果:T检验成对样本统计量均值N 标准差均值的标准误对 1 安慰剂121.80 10 11.419 3.611 组药物组111.80 10 10.185 3.221 由上图可知;对变量各自的统计描述;此处只有1对;故只有对1..此处进行配对变量间的相关性分析配对t检验表;给出最终的检验结果;由上表可见P=0.001;故可认为安慰剂组和药物组对肥胖病人的体重有差别影响实验报告四实验项目:相关分析实验目的:1.学习利用SPSS进行相关分析、偏相关分析、距离分析、线性回归分析和曲线回归..实验内容及步骤(一)两变量的相关分析案例:某医疗机构为研究某种减肥药的疗效;对15位肥胖者进行为期半年的观察测试;测试指标为使用该药之前和之后的体重..编号 1 2 3 4 5服药前198 237 233 179 219服药后192 225 226 172 214编号 6 7 8 9 10服药前169 222 167 199 233服药后161 210 161 193 226编号11 12 13 14 15服药前179 158 157 216 257服药后173 154 143 206 249进行相关双变量分析得出如下输出结果:相关性相关系数系数表..变量间两两的相关系数是用方阵的形式给出的..每一行和每一列的两个变量对应的格子中就是这两个变量相关分析结果结果;共分为三列;分别是相关系数、P值和样本数..由于这里只分析了两个变量;因此给出的是2*2的方阵..由上表可见;服药前和服药后自身的相关系数均为1of course;而治疗前和治疗后的相关系数为0.911;P<0.01(二)偏相关分析偏相关已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据;如表所示..试分析温度与河水流量之间的相关关系..观测数据表月份月平均流量月平均雨量月平均气温1 0.50 0.10 -8.802 0.30 0.10 -11.003 0.40 0.40 -2.404 1.40 0.40 6.905 3.30 2.70 10.606 4.70 2.40 13.907 5.90 2.50 15.408 4.70 3.00 13.509 0.90 1.30 10.0010 0.60 1.80 2.7011 0.50 0.60 -4.8012 0.30 0.20 -6.00由上表可见控制月平均雨量之后;“月平均流量”与“月平均气温”的相关系数为0.365;P=0.27;P>0.05;因此“月平均流量”与“月平均气温”不存在显著相关性..(三)距离分析案例:植物在不同的温度下的生长状况不同;下列是三个温度下的植物生长编号10度20度30度1 12.36 12.4 12.182 12.14 12.2 12.223 12.31 12.28 12.354 12.32 12.25 12.215 12.12 12.22 12.16 12.28 12.34 12.257 12.24 12.31 12.28 12.41 12.3 12.46近似值(四)线性回归分析已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据;如表所示..试分析关系..观测数据表月份月平均流量月平均雨量月平均气温1 0.50 0.10 -8.802 0.30 0.10 -11.003 0.40 0.40 -2.404 1.40 0.40 6.905 3.30 2.70 10.606 4.70 2.40 13.907 5.90 2.50 15.408 4.70 3.00 13.509 0.90 1.30 10.0010 0.60 1.80 2.7011 0.50 0.60 -4.8012 0.30 0.20 -6.00进行线性回归分析得出如下输出结果:回归由表可知;是第一个问题的分析结果..这里的表格是拟合过程中变量进入/退出模型的情况记录;由于只引入了一个自变量;所以只出现了一个模型1在多元回归中就会依次出现多个回归模型;该模型中身高为进入的变量;没有移出的变量; 这里的表格是拟合过程中变量进入/退出模型的情况记录;由于只引入了一个自变量;所以只出现了一个模型在多元回归中就会依次出现多个回归模型;该模型中身高为进入的变量;没有移出的变量..模型汇总模型R R 方调整R方标准估计的误差1 .855a .732 .705 .6117a. 预测变量: 常量; 月平均流量..拟合模型的情况简报;显示在模型中相关系数R为0.855;而决定系数R2为0. 732;校正的决定系数为0.705;说明模型的拟合度较高..Anovab模型平方和df 均方 F Sig.1 回归10.208 1 10.208 27.283 .000a残差 3.741 10 .374总计13.949 11a. 预测变量: 常量; 月平均流量..b. 因变量: 月平均雨量这是所用模型的检验结果;可以看到这就是一个标准的方差分析表从上表可见所用的回归模型F值为27.283;P值为.00a;因此用的这个回归模型是有统计学意义的;可以继续看下面系数分别检验的结果..由于这里所用的回归模型只有一个自变量;因此模型的检验就等价与系数的检验;在多元回归中这两者是不同的..包括常数项在内的所有系数的检验结果..用的是t检验;同时还会给出标化/未标化系数..可见常数项和身高都是有统计学意义的残差统计量a极小值极大值均值标准偏差N 预测值.526 3.113 1.292 .9633 12残差-.6337 1.1358 .0000 .5832 12标准预测值-.795 1.890 .000 1.000 12标准残差-1.036 1.857 .000 .953 12a. 因变量: 月平均雨量图表(五)曲线回归分析某地1963年调查得儿童年龄岁与体重的资料试拟合对数曲线..进行曲线回归分析得出如下输出结果:实验报告五实验项目:聚类分析和判别分析实验目的:1.学习利用SPSS进行聚类分析和判别分析..实验内容及步骤(一)系统聚类法为确定老年妇女进行体育锻炼还是增加营养会减缓骨骼损伤;一名研究者用光子吸收法测量了骨骼中无机物含量;对三根骨头主侧和非主侧记录了测量值;结果见教材表..:主侧桡骨桡骨主侧肱骨肱骨主侧尺骨尺骨受试者编号1 1.103 1.052 2.139 2.238 0.873 0.8722 0.842 0.859 1.873 1.741 0.590 0.7443 0.925 0.873 1.887 1.809 0.767 0.7134 0.857 0.744 1.739 1.547 0.706 0.6745 0.795 0.809 1.734 1.715 0.549 0.6546 0.787 0.779 1.509 1.474 0.782 0.5717 0.933 0.880 1.695 1.656 0.737 0.8038 0.799 0.851 1.740 1.777 0.618 0.6829 0.945 0.876 1.811 1.759 0.853 0.77710 0.921 0.906 1.954 2.009 0.823 0.765输入SPSS建立数据..进行系统聚类分析得出如下输出结果:聚类快捷聚类研究儿童生长发育的分期;调查名1月至7岁儿童的身高cm、体重kg、胸围cm 和资料..求出月平均增长率%;判别分析对某企业;搜集整理了10名员工2009年第1季度的数据资料..构建1个10×6维的矩阵职工代号工作产量工作质量工作出勤工砟损耗工作态度工作能力1 9.68 9.62 8.37 8.63 9.86 9.742 8.09 8.83 9.38 9.79 9.98 9.733 7.46 8.73 6.74 5.59 8.83 8.464 6.08 8.25 5.04 5.92 8.33 8.295 6.61 8.36 6.67 7.46 8.38 8.146 7.69 8.85 6.44 7.45 8.19 8.17 7.46 8.93 5.7 7.06 8.58 8.368 7.6 9.28 6.75 8.03 8.68 8.229 7.6 8.26 7.5 7.63 8.79 7.6310 7.16 8.62 5.72 7.11 8.19 8.181、“分析——分类——判别分析”;把“分类”选入“分组变量”;定义范围:最小值1;最大值4;把X1、X2、X3、X4、X5和X6输入“自变量框”;选择“使用逐步式方法”;2、“统计量”中选择“均值”、“单变量ANOVA”、“Fisher”、“未标准化”、“组内相关”;3、“方法”默认设置;4、“分类”中选择“根据组大小计算”、“摘要表”、“不考虑该个案时的分类”、“在组内”、“合并图、分组、区域图”;5、“保存”中选择“预测组成员”、“判别得分”;6、点击确定..得到以下各表和图..特征值函数特征值方差的% 累积% 正则相关性1 1.002a 100.0 100.0 .707a. 分析中使用了前1 个典型判别式函数..函数1工作质量.270工作产量-.831工作出勤-.406工砟损耗 1.415工作态度 1.879工作能力-2.061结构矩阵函数1工砟损耗.541工作出勤.355工作态度.175工作产量.063工作能力-.056工作质量-.050判别变量和标准化典型判别式函数之间的汇聚组间相关性按函数内相关性的绝对大小排序的变量..典型判别式函数系数函数1工作质量.581工作产量-.830工作出勤-.312工砟损耗 1.248工作态度 2.798工作能力-2.803 常量-6.817非标准化系数组质心处的函数职工代号函数11 -.7312 1.097在组均值处评估的非标准化典型判别式函数分类统计量分类处理摘要已处理的10 已排除的缺失或越界组代码0至少一个缺失判别变量0用于输出中10组的先验概率职工代号先验用于分析的案例未加权的已加权的1 .600 6 6.0002 .400 4 4.000 合计 1.000 10 10.000分类函数系数职工代号1 2工作质量121.299 122.360工作产量-58.894 -60.411工作出勤-14.803 -15.373工砟损耗 3.739 6.020工作态度123.979 129.094工作能力-63.284 -68.407 常量-547.493 -560.691Fisher 的线性判别式函数单独组图表实验报告六实验项目:因子分析和主成分分析实验目的:1.学习利用SPSS进行因子分析和主成分分析..实验内容及步骤(一)因子分析下表资料为15名健康人的7项生化检验结果;6项生化检验指标依次命名为X1至X6;请对该资料进行因子分析..因子分析1.打开导入excle数据2.选择菜单“分析→降维→因子分析” ;弹出“因子分析”对话框..在对话框左侧的变量列表中选除地区外的变量;进入“变量”框;3.单击“描述”按钮;弹出“因子分析: 描述”对话框;在“统计量”中选“单变量描述”项;输出各变量的均数与标准差;“相关矩阵”栏内选“系数”;计算相关系数矩阵;并选“KMO 和 Bartlett’s 球形度检验”项;对相关系数矩阵进行统计学检验;对以上资料进行因子分析:分析——降维——因子分析;确定操作得出描述统计量均值标准差分析 NX1 6.0213 1.23848 15 X2 7.9880 .57340 15 X3 3.9960 1.01195 15 X4 5.5700 1.38699 15 X5 8.3727 .77780 15 X6 8.0247 .68955 15相关矩阵X1 X2 X3 X4 X5 X6相关X1 1.000 .966 .782 .055 .104 .019 X2 .966 1.000 .747 .028 .233 .158X3 .782 .747 1.000 .125 .214 -.024X4 .055 .028 .125 1.000 -.150 .233X5 .104 .233 .214 -.150 1.000 .753X6 .019 .158 -.024 .233 .753 1.000Sig.单侧X1 .000 .000 .423 .356 .473 X2 .000 .001 .461 .202 .287X3 .000 .001 .329 .222 .467X4 .423 .461 .329 .297 .202X5 .356 .202 .222 .297 .001X6 .473 .287 .467 .202 .001KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量.. .460Bartlett 的球形度检验近似卡方64.035 df 15 Sig. .000公因子方差初始提取X1 1.000 .950X2 1.000 .930X3 1.000 .801X4 1.000 .989X5 1.000 .928X6 1.000 .936提取方法:主成份分析..成份矩阵a成份1 2 3X1 .935 -.277 -.021 X2 .954 -.131 -.057 X3 .868 -.218 .030 X4 .107 .059 .987 X5 .389 .839 -.272 X6 .263 .914 .178 提取方法 :主成份..a. 已提取了 3 个成份..旋转成份矩阵a成份1 2 3X1 .975 -.001 .016 X2 .953 .146 -.012 X3 .892 .032 .066 X4 .049 .021 .993 X5 .145 .930 -.205 X6 -.013 .937 .241 提取方法 :主成份..旋转法 :具有 Kaiser 标准化的正交旋转法..a. 旋转在 4 次迭代后收敛..成份转换矩阵成份 1 2 31 .958 .281 .0542 -.284 .957 .0533 -.037 -.066 .997 提取方法 :主成份..旋转法 :具有 Kaiser 标准化的正交旋转法..。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 方差分析 一 实验目的 1. 理解方差分析的概念、原理及作用; 2. 掌握用 SPSS 进行单因素、双因素及协方差分析的方法; 3. 结合参考资料了解方差分析的其它方法及作用。
二 方差分析的原理
方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个: (1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变 量在各组的均值与该组内变量值之偏差平方和的总和表示,记作w SS ,组内自 由度w df ;
(2)实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均 值 与总均值之偏差的总平方和表示,记作b SS ,组间自由度b df 。
三 实验过程
1. 某农场为了比较 4 种不同品种的小麦产量的差异,选择土壤条件基本相同的 土地,分成 16 块,将每一个品种在 4 块试验田上试种,测得小表亩产量(kg) 的数据如表 6.17 所示(数据文件为 data6-4.sav),试问不同品种的小麦的平 均产量在显著性水平 0.05 和 0.01 下有无显著性差异。(数据来源:《SPSS 实 用统计分析》 郝黎仁,中国水利水电出版社) 表 6.17 小麦产量的实测数据 品种 A1 A2 A3 A4
产量 277.5 244.2 249.2 273 276.4 249.5 244.2 240.9 271 236.8 252.8 257.4 272.4 239 251.4 266.5
实验步骤: 第 1 步 分析:由于有一个因素(小麦),而且是 4 种饲料。故不能用独立样本 T 检验(仅适用两组数据),这里可用单因素方差分析; 第 2 步 数据的组织:分成两列,一列是试验田的产量(output),另一列是小 麦品种(breed)(A、B、C、D); 第 3 步 方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同 品种的小麦产量)的总体服从方差相等的正态分布。其中正态分布的要求并不是 很严格,但对于方差相等的要求是比较严格的。因此必须对方差相等的前提进 行检验。从 SPSS 的数据管理窗口中选择 analyze—compare means—One-Way ANOVA,将小麦产量(output)选入 dependent list 框中,将品种(breed)选
1 入 factor 框中,点开 Options,选中 Homogeneity of variance test(方差齐 性检验),点开 post hoc multiple comparisons,将 significance level 的 值在两次实验时分别设置为 0.01 和 0.05。如下图所示:
实验结果及分析: 在 0.05 的显著性水平下 不同小麦的等齐性检验:
方差齐性检验的 H0 假设是方差相等,从上表可看出 Sig.=0.046>0.05,说明应 该接受 H0 假设。 几种小麦的方差检验结果(如下):
组间平方和为 2263.482,自由度(df)为 3,均方为 754.494;组内平方和为 744.715,自由度为 12,均方为 62.060,;F 统计量为 12.518。由于组间比较的
2 相伴概率 Sig(P 值)=0.001<0.05,故应拒绝 H0 假设(四种小麦的产量无显著性 差异),说明四种小麦的产量有显著性差异。 在 0.01 的显著水平下:
在等齐性检验中 Sig.=0.46>0.01,所以接受 H0 假设(四种小麦产量无显著性差 异),组间比较的相伴概率 Sig(P 值)=0.001<0.01, 故应拒绝 H0 假设(四种小 麦的产量无显著性差异),说明四种小麦的产量有显著性差异。 因此,在显著性水平 0.05 和 0.01 下,四种不同小麦的产量有显著性差异
2. 某公司希望检测四种类型的轮胎 A,B,C,D 的寿命(由行驶的里程数决定), 见表 6.18(单位:千英里)(数据文件为 data6-5.sav),其中每种轮胎应用在 随机选择的 6 辆汽车上。在显著性水平 0.05 下判断不同类型轮胎的寿命间是否 存在显著性差异?(数据来源:《统计学(第三版)》,M.R.斯皮格尔,科学出 版社) 表 6.18 四种轮胎的寿命数据 A 33 38 36 40 31 35 B 32 40 42 38 30 34 C 31 37 35 33 34 30 D 29 34 32 30 33 31
实验步骤: 第 1 步 分析:由于有一个因素(轮胎),而且是 4 种饲料。故不能用独立样 本 T 检验(仅适用两组数据),这里可用单因素方差分析; 第 2 步 数据的组织:分成两列,一列是轮胎(tyre),另一列是里程 (mileage); 第 3 步:方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同 类型轮胎的寿命)的总体服从方差相等的正态分布。其中正态分布的要求并不是 很严格,但对于方差相等的要求是比较严格的。因此必须对方差相等的前提进 行检验。从 SPSS 的数据管理窗口中选择 analyze—compare means—One-Way
3 ANOVA,将轮胎(tyre)选入 dependent list 框中,将里程(mileage)选入 factor 框中,点开 Options,选中 Homogeneity of variance test(方差齐性 检验),点开 post hoc multiple comparisons,将 significance level 的值 设置为 0.05。
实验结果及分析:
从上面两个表可以看出:方差齐性检验的 H 0 假设是方差相等,从上表可看出 Sig.=0.50>0.05,说明应该接受 H 0 假设。组间平方和为 77.500,自由度(df) 为 3,均方为 25.833;组内平方和为 216.333,自由度为 20,均方为 10.817;2.388。由于组间比较的相伴概率 Sig(P 值)=0.99>0.05,故应接受 H 0
假设(四种轮胎的寿命无显著性差异),说明四种轮胎的寿命无显著性差异。 如
果想进一步了解空间是哪种和其他组有显著性的均值差别(即哪种轮胎更好) ,就需要在多个样本均值间进行两两比较。单击 Post Hoc 按钮,打开击 Post Hoc 按钮,打开 One-Way ANOVA:Post Hoc MultipleComparisions 对话框,如 图所示。在其中可以选择一种或几种比较分析的方法。
输出结果为: 4 从上面分析我们可以看出,B 型轮胎相比于 A、C、D、要好,D 型轮胎的寿命最 短。
3. 某超市将同一种商品做 3 种不同的包装(A)并摆放在 3 个不同的货架区 (B)进行销售试验,随机抽取 3 天的销售量作为样本,具体资料见表 6.20。 要求检验:在显著性水平 0.05 下商品包装、摆放位置及其搭配对销售情况是否 有显著性影响。(数据来源:《应用统计学》 耿修林,科学出版社;数据文件: data6-7.sav) 表 6.20 销售样本资料 B1 B2 B3 A1 5,6,4 6,8,7 4,3,5 A2 7,8,8 5,5,6 3,6,4 A3 3,2,4 6,6,5 8,9,6
实验步骤: 第 1 步 分析:需要研究不同教学方法和不同性别对数学成绩的影响。这是一 个多因素(双因素)方差分析问题。 第 2 步 按 Analyze|General Linear Model|Univariate 的步骤打开 Univariate 对话框。并将“销量” 变量移入 Dependent Variable 框中,将“包装”和“摆放位置”移入 Fixed Factor(s)中,如图:
5 第 3 步 单击 Options,由于方差分析的前提上方差相等,故应进行方差齐性检 验,选中 “Homogeneity tests”; 第 4 步。打开 Univariate:Post Hoc Multiple Comparisons for Observed Means 对话框,在其中选出需要进行比较分析的对话框,这里选“组别”,再 选择一种方差相等时的检验模型和不相等时的检验模型; 第 5 步 选择建立多因素方差分析的模型种类。打开 Model 对话框,本例用默 认的 Full factorial 模型。这种模型将观察变量总的变异平方和分解为多个控 制变量对观察变量的独立部分、多个控制变量交互作用部分以及随机变量影响 部分。 第 6 步 以图形方式展示交互效果。如果各因素间无交互效果,则各个水平对 应的图形应近于平行,否则相交。点开 Plots,选择两个变量之交互作用,如图:
第 7 步 对控制变量各个水平上的观察变量的差异进行对比检验。选择 Contrasts 对话框,对两种因素均进行对比分析,方法用 Simple 方法,并以 最后一个水平的观察变量均值为标准。(选择 Contrasts 方式后需单击 Change 进行确认) 第 8 步 运行结果及分析。
实验结果及分析: 分组描述:
6 方差齐性检验结果: 是对销量进行方差齐性检验的结果,可以看出方差无显著差异,应用前面的 LSD 方法的结果 如下: 多因素方差分析及交互检验:
该表是进行多因素方差分析的主要部分,由于指定建立饱和模型,因此总的离 差平方和分为 3 个部分:多个控制变量对观察量的独立作用、交互作用及随机 变量的影响。 关于多个控制变量的独立作用部分。不同包装贡献离差平方和为 0.963,均方 0.481 不同 摆放位置贡献离差平方和为 3.185,均方为 1.593,这说明摆放位置比包装影响 大。从相伴概率来看,都小于 0.05,说明两者均有影响。 关于多个控制变量的交互作用部分,这里组别与性别的交互作用的离差平方和 为 61.259,均方为 15.315,F 值与相伴概率为 14.259 和 0.000。表明它们的交 互作用对观察结果造成了显著影响。Error 部分是随机变量影响部分。
7