SPSS操作实验作业1(附答案)

合集下载

spss实践题分析及答案

spss实践题分析及答案

spss实践题分析及答案SPSS实践题习题1分析此班级不同性别的学⽣的物理和数学成绩的均值、最⾼分和最低分。

Report性别数学物理男⽣Mean 80.0769 74.5385N 13 13Std. Deviation 5.75125 5.17390Minimum 72.00 69.00Maximum 95.00 87.00⼥⽣Mean 80.7692 76.1538N 13 13Std. Deviation 8.91772 8.32512Minimum 70.00 65.00Maximum 99.00 91.00Total Mean 80.4231 75.3462N 26 26Std. Deviation 7.36029 6.84072Minimum 70.00 65.00Maximum 99.00 91.00结论:男⽣数学成绩最⾼分: 95 最低分: 72 平均分: 80.08物理成绩最⾼分: 87 最低分: 69 平均分: 74.54⼥⽣数学成绩最⾼分: 99 最低分: 70 平均分: 80.77 物理成绩最⾼分: 91 最低分: 65 平均分: 76.15 习题2分析此班级的数学成绩是否和全国平均成绩85存在显著差异。

One-Sample StatisticsNMean Std. Deviation Std. Error Mean数学2680.42317.360291.44347结论:由分析可知相伴概率为0.004,⼩于显著性⽔平0.05,因此拒绝零假设,即此班级数学成绩和全国平均⽔平85分有显著性差异习题3分析市2⽉份的平均⽓温在90年代前后有⽆明显变化。

Group Statistics分组 NMean Std. Deviation Std. Error Mean⼆⽉份⽓温0 11 -4.527273 1.2034043.3628400 118-3.2000001.3006786.3065729结论:由分析可知, ⽅差相同检验相伴概率为0.322,⼤于显著性⽔平0.05,因此接受零假设,90年代前后2⽉份温度⽅差相同。

SPSS上机实验报告一

SPSS上机实验报告一

1.数据文件的建立。

打开SPSS,在数据编辑器的变量视图中,输入变量的属性特征,如Name,Width,Decinmal等。

以习题一为例,输入为下:返回数据编辑库,数据视图,直接录入数据。

习题一的数据表如下:点击Save,输入文件名将文件保存。

2.数据的整理数据编辑窗口的Date可提供数据整理功能。

其主要功能包括定义和编辑变量、观测量的命令,变量数据变换的命令,观测量数据整理的命令。

以习题一为例,将上图中的数据进行整理,以GDP值为参照,升序排列。

数据整理后的数据表为:整理后的数据,可以直观看出GDP值的排列。

3、频数分析。

以习题一为例(1).单击“分析→描述统计→频率”(2)打开“频率”对话框,选择GDP为变量(3)单击“统计量”按钮,打开“统计量”对话框.选择中值及中位数。

得到如下结果:(4)单击“分析→描述统计→探索”,打开“探索”对话框,选择GDP(亿元),输出为统计量。

结果如下:4、探索分析以习题2为例子:(1)单击“分析→统计描述→频率”,打开“频率”对话框,选择“身高”变量。

(2)选择统计量,分别选择百分数,均值,标准差,单击图标。

的如下结果:(3)单击“分析→统计描述→探索”,选择相应变量变量,单击“绘制”,选择如下图表,的如下结果:从上述图标可以看出,除了个别极端点以外,数据都围绕直线上下波动,可以看出,该组数据,在因子水平下符合正态分布。

4.交叉列联表分析:以习题3,原假设是吸烟与患病无关备择假设是吸烟与患病有关操作如下:单击“分析→统计描述→交叉表”,打开“交叉表”对话框,选择相应变量变量,单击精确,并选择“统计量”按钮,选择“卡方”作为统计量检验,然后单击“单元格”按钮,选择“观测值”和“期望值”进行计数。

得出分析结果如下:分析得出卡方值为7.469,,自由度是1,P值为0.004<0.05拒绝原假设,故有大于95%的把握认为吸烟和换慢性气管炎有关。

习题4:原假设是性别与安全性能的偏好无关备择假设是性别与安全性能的偏好有关操作如下:单击“分析→统计描述→交叉表”,打开“交叉表”对话框,选择相应行列变量然后选择“统计量”按钮,以“卡方”作为统计量检验.单击“单元格”按钮,选择“观测值”和“期望值”进行计数单击“确定”,得出分析结果如下:分析得出卡方值为19自由度是4,P值为0.001<0.05拒绝原假设,故有99.9%的把握认为性别与安全性能的偏好有关5实验作业补充。

SPSS上机考试练习试题-1

SPSS上机考试练习试题-1

SPSS统计软件上机练习题(第一部分)1.10名15岁中学生身高体重数据如下:表110名15岁中学生身高体重数据编号12345678910性别男男男男男女女女女女身高(cm)166.0169.0170.0165.1172.0159.4161.3158.0158.6169.0体重(kg)57.058.551.058.055.044.745.444.342.851.5体重指数(BMI)=体重(kg)/身高(m)2,即体重(kg)除以身高(m)的平方。

请利用SPSS计算男生和女生体重指数的均数、标准差值。

2.将126例十二指肠球部溃疡病人随机分为两组。

甲药组治疗62人,54人有效;乙药组治疗64人,44人有效。

请用SPSS分析两种药物的治疗效果有无差别?3.某医师研究物理疗法、药物疗法和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表3。

请用SPSS试比较三种疗法的有效率有无差别?如有差别,哪些组间有差异?表3三种疗法治疗周围性面神经麻痹的疗效分组治疗例数有效例数有效率(%)物理疗法20619996.6药物疗法18216490.1外用膏药14411881.94.某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见表4。

请用SPSS比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别?表4DN组与无DN组2型糖尿病患者ACE基因型分布的比较组别DD ID II合计DN组42(37.8)48(43.3)21(18.9)111无DN组30(21.7)72(52.2)36(26.1)138合计72(28.9)120(48.2)57(22.9)2495.测得某地5801人的ABO血型和MN血型结果如表5,请用SPSS比较两种血型系统之间是否有关联?如果有关联,关联强度多大?表5测得某地5801人的血型结果ABO血型MN血型合计M N MNO4314909021823A3884108001598B4955879502032AB137********合计14511666268458016.某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表6,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势?表6年龄与冠状动脉硬化的关系年龄(岁) (X)冠状动脉硬化等级(y)—++++++合计20~7022429830~2724936340~162313759≥50920151458合计122894126278(1)选用SPSS过程:Weight cases;Analyze→Descriptive Statistics→Crosstabs。

SPSS操作实验作业1(附答案)

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1)作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。

然而,当代大学生对华夏文明究竟知道多少呢某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。

调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。

调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。

请利用这些资料,分析以下问题。

问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。

问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。

要求:直接导出查看器文件为.doc后打印(导出后不得修改)对分析结果进行说明,另附(手写、打印均可)。

于作业布置后,1周内上交本次作业计入期末成绩答案问题一操作过程1.打开数据文件作业。

同时单击数据浏览窗口的【变量视图】按钮,检查各个变量的数据结构定义是否合理,是否需要修改调整。

2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对话框。

在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。

3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字“5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。

接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。

再单击【继续】按钮,返回【频率】对话框。

4.单击【图表】按钮,勾选【直方图】和【显示正态曲线】复选框,即直方图中附带正态曲线。

再单击【继续】按钮,返回【频率】对话框。

最后,单击【确定】按钮,操作完成。

SPSS简单的练习作业

SPSS简单的练习作业
(3)
在上图中,分别显示了两两广告形式下销售额均值检验的结果。在SPSS中全部采用了LSD方法中的分布标准误,因此各种方法的前两列计算结果完全相同。表中第三列是检验统计量观测值在不同分布中概率值p,可以发现各种方法在检验敏感度上市存在差异的。以报纸广告与其他三种广告形式的两两检验结果为例,如果显著性水平α=0.05,在LSD方法中,报纸广告和广播广告的效果没有显著性差异,p值为0.412,与宣传品和体验均有显著性差异,概率p值分别是0.00,接近和0.021;但是在其他三种方法中,报纸广告只与宣传品广告存在显著性差异,而与体验无显著性差异。表中第一列星号的含义是,在显著性水平α=0.05的情况下,相应两总体的均值存在显著性差异,与第三列的结果相对应。
实验一SPSS的方差分析、相关分析与线性回归分析………………………17
1.单因素方差分析的基本操作……………………………………………17
2.单因素方差分析进一步分析的操作……………………………………18
作业一SPSS数据文件的建立和管理、数据的预处理
实验一SPSS数据文件的建立和管理、数据的预处理
【实验目的】
【实验结果与分析】
以上结果是广告形式对销售额的单因素方差的分析结果。可以看到,观测变量销售额的总离差平方和为26169.306;如果仅考虑“广告形式”单个因素的影响,则销售额总变差中,广告形式可解释的变差为5866.083,抽样误差引起的变差为20303.222,它们的方差(平均变差)分别为1955.361和145.023,相除所得的F统计量的观测值为13.483,对应的概率p值近似为0。如果显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝零假设,认为不同广告形式对销售产生显著影响,它对销售额的影响效应不全为0。

SPSS实验上机题

SPSS实验上机题

SPSS实验上机题实验1 数据文件建立与管理某航空公司38名职员性别和工资情况的调查数据,如下表所示,试在SPSS中进行如下操作:(1)定义变量,将gender定义为字符型变量,salary定义为数值型变量,在数据窗口录入数据,并保存数据文件,将其命名为“data1_1.sav”。

(2)打开文件data1_1.sav,练习增加一个个案,删除一个个案,增加一个变量、删除一个变量,以及个案和变量的复制、粘贴操作。

(3)将数据文件按性别分组;将数据文件按工资进行组距分组。

(4)查找工资大于40000美元的职工。

(5)按工资进行升序和降序排列,比较升序和降序排列结果有什么不同。

(6)练习数据的分类汇总操作,要求按照性别分类汇总样本的总数。

(7)练习数据选取操作,要求随机选取70%的数据。

(8)当工资大于40000美元时,职工的奖金是工资的20%;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并将结果添加到income变量中。

实验2 数据特征的描述统计分析1.下表是一电脑公司某年连续120天的销售量数据(单位:台)。

试对其进行频数分析,计算均值、中位数、众数、四分位数,标准差、最大值、最小值、全距,偏度、峰度系数;画出直方图、茎叶图、箱线图;解释结果并说明其分布特征。

234159187155158172163183182177156165 143198141167203194196225177189203165 187160214168188173176178184209175210161152149211206196196234185189196172 150161178168171174160153186190172207 228162223170208165197179186175213176 153163218180192175197144178191201181 166196179171210233174179187173202182 154164215233168175198188237194205195 1742261801722111902001721871891881952.下表是某班同学月生活费资料,试对其进行描述分析,并对结果作出说明。

SPSS实验报告一题目和答案

SPSS实验报告一题目和答案

广东金融学院实验报告课程名称:③由表报告可知,这三个行业平均收入最高:“科学研究、技术服务地质勘察业”的平均收入为8294.9983:“卫生、社会保障和社会福利业”的平均收入为5989.8982;“水利、环境和公共设施管理业”的平均收入为5076.2500。

报告总收入行业N 均值农林牧渔业24 4304.2083采矿业12 1658.3333制造业969 3554.4152电力、燃气及水的生产供应业120 4123.0724建筑业145 2759.1807交通运输、仓储和邮政业196 3222.4676信息传输、计算机服务和软件业123 3332.5672批发和零售业480 3202.4359住宿和餐饮业120 2772.3000金融业329 4350.7240房地产业82 2888.2317租赁和商务服务业87 2765.6685科学研究、技术服务地质勘察业12 8294.9983水利、环境和公共设施管理业36 5076.2500居民服务和其他服务业317 2447.8026教育368 4514.8723卫生、社会保障和社会福利业147 5989.8982文化、体育和娱乐业132 4300.9326公共管理和社会组织512 4427.6971无就职行业1356 2022.2584总计5567 3315.89423. ①由表描述量统计可知:筛选除去无收入者,对总收入进行标准化处理,其均值为0,标准差为1。

描述统计量N 均值标准差Zscore: 总收入5567 0.0000000 1.00000000有效的 N (列表状态)5567②由表异常值可知:异常值的比重是1.9%异常值频率百分比有效百分比累积百分比有效.00 105 1.9 1.9 1.91.00 5462 98.1 98.1 100.0合计5567 100.0 100.0(二)第二题:1. ①由表购买保险情况可知,商业保险、养老保险和医疗保险都买的人的比例是5.8%;一种保险都没买的人的比例是44.4%。

统计SPSS第一次作业参考答案

统计SPSS第一次作业参考答案

参考答案1、一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。

(1) 这一研究的总体是什么?(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?研究者所关心的参数是什么?(3) “消费者每月在网上购物的平均花费是200元”是参数还是统计量?(4) 研究者所使用的主要是描述统计方法还是推断统计方法?答:(1)总体是“所有网上购物的消费者”;(2)分类变量;所有网上购物的消费者的月平均花费和网上购物的主要原因;(3)统计量;(4)推断统计方法。

2、解:年份 经济增长率 年份 经济增长率1992 9.40 2002 8.821993 1.24 2003 7.041994 3.15 2004 3.351995 9.55 2005 4.281996 3.24 2006 1.591997 1.85 2007 10.971998 1.67 2008 4.121999 5.93 2009 5.952000 4.04 2010 2.732001 4.93从上图中可以看出,从1992-2010年,该地区的经济增长率上下波动幅度较大。

虽说经济每年都在增长,但增长速度不够稳定。

总体来看,呈现循环波动的特点,但周期不固定。

3、因每人抽取样本不同,结果会有差异,但分析的方法和图表选择应差不多。

(1)分析“上月收入”的分布特征,并绘制合适图表。

Excel:接收区域 频率1300以下 51300-1700 191700-2000 452000-2300 392300-2700 482700-3000 143000-4100 8SPSS:新上月工资频率 百分比 有效百分比 累积百分比1300.00 5 2.8 2.8 2.8 有效1700.00 19 10.7 10.7 13.52000.00 45 25.3 25.3 38.82300.00 39 21.9 21.9 60.72700.00 48 27.0 27.0 87.63000.00 14 7.9 7.9 95.53300.00 8 4.5 4.5 100.0合计 178 100.0 100.0观察样本的数据,发现上月工资在800-4100之间分布,将工资进行分组,绘制出上图。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS操作实验 (作业1)
作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。

然而,当代大学生对华夏文明究竟知道多少呢
某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。

调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。

调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。

请利用这些资料,分析以下问题。

问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。

问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。

要求:
直接导出查看器文件为.doc后打印(导出后不得修改)
对分析结果进行说明,另附(手写、打印均可)。

于作业布置后,1周内上交
本次作业计入期末成绩
答案
问题一
操作过程
1.打开数据文件作业。

同时单击数据浏览窗口的【变量视图】按钮,检查各个
变量的数据结构定义是否合理,是否需要修改调整。

2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对
话框。

在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。

3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字
“5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。

接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。

再单击【继续】按钮,返回【频率】对话框。

4.单击【图表】按钮,勾选【直方图】和【显示正态曲线】复选框,即直方图
中附带正态曲线。

再单击【继续】按钮,返回【频率】对话框。

最后,单击【确定】按钮,操作完成。

5.在得到第20%、40%、60%和80%百分位数后,接着以它们为断点对得分数
据进行分类,因此可以利用SPSS中的【编码】功能来实现。

打开SPSS软件,在菜单栏中选择【文件】→【转换】→【重新编码为不同变量】命令,弹出【重新编码为不同变量】对话框。

6.在左侧的候选变量列表框中选择“X9”变量进入【输入变量->输出变量】列
表框,同时在【输出变量】复选框中填写输出赋值变量名称“等级”。

同时单击【更改】按钮进行赋值转换。

单击【旧值和新值】按钮,弹出重编码规则设置对话框。

接着按照等级转换赋值规则进行变量的重新赋值工作。

设置完成后,单击【继续】按钮返回主对话框最后,单击【确定】按钮,操作完成。

此时,原数据文件新增加了“天数”变量。

问题二
对于问题二,大学生获取传统文化来源主要是从学校、家庭或自学等。

因此本问题主要要分析不同学习途径对大学生传统文化了解程度是否存在显着性影响。

由于文化来源途径和了解程度等级都是定性数据,因此可以考虑采用列联表分析中的行、列变量相关程度检验。

1.选择菜单栏中的【分析】→【描述统计】→【交叉表】命令,弹出【交叉表】
对话框。

2.单击【统计量】按钮,在弹出的对话框的【交叉表:统计量】中,勾选卡方,
这是利用卡方检验来检验学习途径和了解程度得分等级两者之间的独立性。

再单击【继续】按钮,返回【交叉表】对话框,单击【确定】按钮完成操作。

结果分析
问题一
(1)描述性统计量表
下表是被调查者对中国传统文化了解程度得分的描述性统计量
输出表,其中包括了均值、中位数、方差等基本统计量。

可以看到,大学生对传统中国文化了解程度得分均值等于分,标准差为,偏度为,峰度为等。

(2)直方图
SPSS输出结果也包括直方图。

从图形特征看,数据呈稍微左偏分布。

根据附带的正态分布曲线可见了解程度得分近似服从正态分布N,,说明大学生对中国传统文化的了解程度差异较大。

问题二
(1)来源途径与了解程度等级的列联表
下表是来源途径与了解程度等级的列联表,表中数据列出了处于不同了解程度等级及来源途径的学生人数。

可以看到,以“学校教育”为主要来源途径的学生大多数对传统中国文化了解程度位于“很不了解”和“不太了解”的等级,而采用“自学”方式来获取传统文化的学生对其了解程度都比较高,多数学生都“比较了解”或“很了解”传统文化。

(2)独立性检验
上面的列联表只是从数值大小的角度说明了不同来源途径的学生对传统中国文化了解程度差异很大,但究竟这种级别有无显着性差异,还是要借助于卡方检验。

下表是“来源途径”对“了解程度等级”有无显着性影响的卡方检验结果。

卡方检验的零假设是不同来源途径对传统文化了解程度没有显着性差异。

系统默认显着性水平为,由于卡方检验概率P值都小于,则拒绝零假设,认为来源途径对学生了解中国传统文化程度有显着性差异。

这表示应努力激发学生对传统文化的兴趣,只有建立在兴趣爱好的基础上,学生即使花费自己的工作学习时间,也会自学中国传统文化,提高自身的文化修养水平。

卡方检验
值df渐进Sig. (双侧)
Pearson 卡方8.011
似然比8.009
线性和线性组合1.000
有效案例中的N228
a. 0 单元格(.0%) 的期望计数少于5。

最小期望计数为。

相关文档
最新文档