SPSS作业

合集下载

SPSS作业2

SPSS作业2

二.
1〕.试录入以下数据文件,保存为“数据1.sav”。

2〕.试录入以下数据文件,保存为“数据2.sav”。

3〕.试将数据2合并到数据1,合并后的数据文件另存为“数据3.sav”。

4〕.将工资进行重编码,2000以下〔含2000〕为1,2000-3000为2,3000-4000为 3,4000以上为4,重编码的结果保存为“工资等级”。

新数据文件保存为“数据4.sav”。

5〕.求出各职工刚进入公司时的年龄,保存为“初入年龄”。

新数据文件保存为“数据5.sav”。

6〕.试按各职员的工资数进行排秩,排秩要求工资最高的排为第一,相同数额取平均等级。

排秩后的数据文件保存为“数据6.sav”。

7〕.试按各职员的工资数分性别进行排序,要求先排男性,后排女性。

同一性别按工资从高到低排列。

排序后的数据文件保存为“数据7.sav”。

8〕.试寻找一个新数据文件,将其中一些新变量合并到数据文件7中,合并后的新数据文件保存为“数据8.sav”。

SPSS假设检验作业

SPSS假设检验作业

统计作业(假设检验)1、应用SPSS计算下题:已知某炼铁厂的铁水含碳量服从正态分布,在正常情况下,其总体均值为 4.55。

现在测了10炉铁水,其含碳量分别为4.42, 4.38, 4.28, 4.40, 4.42, 4.35, 4.37, 4.52, 4.47, 4.56 ,试问总体均值是否发生了显著变化(α=0.05)?One-Sample Test此题为双侧检验,因此P=0.001<0.025,拒绝H0,所以总体均值发生了显著变化2、文件名:DATA11-01文件说明:从一所学校中抽取27名男女学生身高数据。

变量说明:no: 编号;sex:性别;age:年龄;h:身高;w:体重。

假设该学校身高服从正态分布,请问能否认为该学校学生平均身高为1.57m(α=0.01)。

One-Sample Test此题为双侧检验,P=.003<.005,拒绝H0,所以不能认为该学校学生平均身高为1.57m3、文件名:DATA11-02文件说明:1973年某市测量120名12岁男孩身高资料。

变量说明:height: 12岁男孩身高当显著性水平分别为α=0.05与0.01时,该市12岁男孩平均身高与该地区男孩平均身高(142.3cm)有无显著差异,并说明所得结论的理由。

当α=0.05时One-Sample Statistics此题为双侧检验,因此P=.162>.025,所以该市12岁男孩平均身高与该地区男孩平均身高(142.3cm)无显著差异当α=0.01时One-Sample StatisticsOne-Sample Test此题为双侧检验,因此P=.162>.005,所以该市12岁男孩平均身高与该地区男孩平均身高(142.3cm)无显著差异4、文件名:DATA09-03文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。

SPSS作业(1-5章)3.27

SPSS作业(1-5章)3.27

第一章 SPSS概述1. SPSS有哪些主要窗口?它们的作用和特点各是什么?2. SPSS有哪三种主要使用方式?各自的特点是什么?3. .sav,.spo,.sps分别是哪类文件的扩展名?4.在SPSS的输出窗口中应如何操作才能将不同的分析结果保存到不同的文件中?5.SPSS的数据加工和管理功能主要集中在哪些菜单中?统计绘图和分析功能主要集中在哪些菜单中?6.利用SPSS进行数据分析的一般基本步骤是什么?第二章SPSS数据文件的建立和管理1. SPSS中有哪两种基本数据组成方式?各自的特点和应用场合是什么?2. 在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明?3你认为SPSS数据窗口与Excel工作表在基本操作方式和数据组织方式方面有什么异同?4.先自己建立两个数据文件:“学生成绩一.sav”和“学生成绩二.sav”,分别存放关于学生学号、性别、和若干门课程成绩的数据,然后将这两个数据文件横向合并,形成一个完整的数据文件。

6根据P18案例2-2建立数据文件,要求完整的数据结构。

7针对当前社会或社会关心的热点问题,以小组形式设计一份调查问卷并进行调查。

试在SPSS中录入所获得的调查数据形成一份SPSS数据文件。

其中,变量的类型应包括字符型和数字型,变量的计量尺度应包括定距型、定类型和定序型。

如果调查资料中存在缺失数据,应在SPSS数据文件的建立过程中进行必要的定义说明。

第三章SPSS数据的预处理1.利用数据筛选功能,将住房状况调查.sav生成两个文件,其中第一个文件存储户口为“外地户口”且家庭收入在10000-15000之间的数据;第二个文件存储按简单随机抽样抽取的70%的样本数据2.利用住房状况调查.sav 将其按家庭收入(升序)、现住面积(升序)、计划面积(降序)进行多重排序。

3.利用学生成绩表.sav 对每个学生计算得优课程数和得良课程数,并按得优课程数进行降序排列。

北语21春《SPSS统计分析进阶》离线作业满分答案

北语21春《SPSS统计分析进阶》离线作业满分答案

北语21春《SPSS统计分析进阶》离线作业满分答案第一题:描述性统计分析数据准备操作步骤1. 打开SPSS,导入数据集。

2. 在菜单栏中选择“分析”→“描述性统计”→“频率”。

3. 将年龄、性别、收入和受教育程度变量拖动到“变量”框中。

4. 点击“确定”执行分析。

满分答案根据分析结果,我们可以得到以下描述性统计结果:- 年龄的平均值为35岁,标准差为10岁。

- 性别的分布中,男性占60%,女性占40%。

- 收入的平均值为5000元,标准差为2000元。

- 受教育程度的分布中,初中及以下占30%,高中/中专占40%,大专占20%,本科及以上占10%。

第二题:t检验数据准备我们需要准备一份数据集,数据集中包含两个变量:治疗前得分(pre_score)和治疗后得分(post_score)。

操作步骤1. 打开SPSS,导入数据集。

2. 在菜单栏中选择“分析”→“比较平均值”→“独立样本t检验”。

3. 将治疗前得分和治疗后得分变量拖动到“变量”框中。

4. 点击“确定”执行分析。

满分答案根据分析结果,我们可以得到以下t检验结果:- t值为2.56,p值为0.01。

- 治疗后的得分显著高于治疗前的得分(p<0.05)。

第三题:方差分析数据准备我们需要准备一份数据集,数据集中包含两个变量:组别(group)和得分(score)。

操作步骤1. 打开SPSS,导入数据集。

2. 在菜单栏中选择“分析”→“比较平均值”→“单因素方差分析”。

3. 将组别变量拖动到“因子”框中,将得分变量拖动到“变量”框中。

4. 点击“确定”执行分析。

满分答案根据分析结果,我们可以得到以下方差分析结果:- F值为3.34,p值为0.03。

- 组别对得分有显著影响(p<0.05)。

第四题:回归分析数据准备操作步骤1. 打开SPSS,导入数据集。

2. 在菜单栏中选择“分析”→“回归”→“线性”。

3. 将年龄、性别、收入和受教育程度变量拖动到“自变量”框中,将目标变量拖动到“因变量”框中。

spss作业

spss作业

八、上机作业
1、自学报告分析的各项命令。

2、以“职工数据.sav”为例,要求用基本统计分析完成以下任务:(1)求出性别、工资等级的频次分布表,并用工资等级做条形图、饼形图。

表2 性别表
求工资的均值、中位数、众数、最大值、最小值、标准差、四分位数、十分位数,并用工资做带正态曲线的
F r e q u e n c y
表3 工资的各种数值表
平均值 中位数 众数 标准差 峰度 偏度 最小值 最大值 四分位

十分位
数 3130
3100
1800
1073
201
970
1500 5000 1500
1800
F r e q u e n c y
分性别求工资的标准分。

表4 Descriptive Statistics(a)
表5 Descriptive Statistics(a)
3、依据“保险市场调查”数据,对变量q13a、q13b、q13c进行多选项分析,了解人们购买商业养老保险的原因。

①定义多选项变量集
②多选项频数分析
③以工作单位性质(q34)和购买商业养老保险的原因为变量,进行列联表分析。

SPSS操作实验作业1(附答案)

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1)作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。

然而,当代大学生对华夏文明究竟知道多少呢某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。

调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。

调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。

请利用这些资料,分析以下问题。

问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。

问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。

要求:直接导出查看器文件为.doc后打印(导出后不得修改)对分析结果进行说明,另附(手写、打印均可)。

于作业布置后,1周内上交本次作业计入期末成绩答案问题一操作过程1.打开数据文件作业。

同时单击数据浏览窗口的【变量视图】按钮,检查各个变量的数据结构定义是否合理,是否需要修改调整。

2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对话框。

在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。

3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字“5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。

接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。

再单击【继续】按钮,返回【频率】对话框。

4.单击【图表】按钮,勾选【直方图】和【显示正态曲线】复选框,即直方图中附带正态曲线。

再单击【继续】按钮,返回【频率】对话框。

最后,单击【确定】按钮,操作完成。

SPSS简单的练习作业

(3)
在上图中,分别显示了两两广告形式下销售额均值检验的结果。在SPSS中全部采用了LSD方法中的分布标准误,因此各种方法的前两列计算结果完全相同。表中第三列是检验统计量观测值在不同分布中概率值p,可以发现各种方法在检验敏感度上市存在差异的。以报纸广告与其他三种广告形式的两两检验结果为例,如果显著性水平α=0.05,在LSD方法中,报纸广告和广播广告的效果没有显著性差异,p值为0.412,与宣传品和体验均有显著性差异,概率p值分别是0.00,接近和0.021;但是在其他三种方法中,报纸广告只与宣传品广告存在显著性差异,而与体验无显著性差异。表中第一列星号的含义是,在显著性水平α=0.05的情况下,相应两总体的均值存在显著性差异,与第三列的结果相对应。
实验一SPSS的方差分析、相关分析与线性回归分析………………………17
1.单因素方差分析的基本操作……………………………………………17
2.单因素方差分析进一步分析的操作……………………………………18
作业一SPSS数据文件的建立和管理、数据的预处理
实验一SPSS数据文件的建立和管理、数据的预处理
【实验目的】
【实验结果与分析】
以上结果是广告形式对销售额的单因素方差的分析结果。可以看到,观测变量销售额的总离差平方和为26169.306;如果仅考虑“广告形式”单个因素的影响,则销售额总变差中,广告形式可解释的变差为5866.083,抽样误差引起的变差为20303.222,它们的方差(平均变差)分别为1955.361和145.023,相除所得的F统计量的观测值为13.483,对应的概率p值近似为0。如果显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝零假设,认为不同广告形式对销售产生显著影响,它对销售额的影响效应不全为0。

spss 统计分析与应用 作业

统计分析与SPSS应用作业目录第一题 (1)第二题 (4)第三题 ................................................................................................................................................第一题:使用的数据文件为自己编辑的workerxinxi.sav 具体data view如下数据属性variable view如下其中sex的value值设定如下renge的value值设定如下jixiao的value值设定如下Frequencies过程的结果:对weight字段用frequencies过程分析的结果如下体重由第一张表可以看出,被调查的工人样本的体重的四分位数分别为:48.2500kg,54.0000kg,63.7500kg。

第二张表可以看出体重的累积分布百分数,有百分之64.3%的工人的体重位于49kg—70kg之间。

表中给出了人格类型和绩效评级的频数表,其中Frequency为频数,Percent为各族频数占总例数的百分比(包括缺失数据),Valid Percent为各组频数占总例数的有效百分比,因为我所选用的工人信息表中没有缺失数据,因此Percent和Valid Percent 字段的值是相同的。

Cumulative Percent为各组频数占总例数的累积百分比。

在有关人格类型分析的表中,可见,大多数工人有传统型或者现实型人格,共有大约67.9%。

在绩效评级分析的表中,可见,大多数人达到了C级以上的绩效评级。

总体而言该公司的绩效评级体制还是合理的。

Descriptive过程的结果对height字段用descriptive过程分析结果如下可看出,被调查的28个样本中,身高最大值为186cm,最小值为152cm,均值为167.82cm,标准误差为7.31337Explore模块分析结果从上两张图中可以看出集中趋势指标、离散趋势指标、分布特征指标和参数估计值等。

spss作业完整版

均值比较与样本T检验1、(1)执行Transform—>Replace Missing Varies,将“机械化程度”移入NewVariables中,在Method中选择Mean of nearby points,单击change,单击OK提交系统。

(2)执行analyze->compare means->mean,将“户主年龄”、“文化程度”、“家庭人口”和“家庭总收入”移入 indenpendent List,将“机械化程度”移入dependent list(3)单击options,选择statistics for first layer 下的 anova table and eta, 单击 continue(4)单击ok数据分析:缺失值由3.8代替,所以用无任何机械代替。

年龄:显著性水平Sig.=0.572>0.05,说明不同户主年龄的机械化程度没有显著的差异。

文化程度:显著性水平Sig.=0.453,说明不同文化程度的机械化程度没有显著性差异;家庭人口:Sig.=0.625,说明不同家庭人口数的机械化程度没有显著性差异;家庭总收入:Sig.=0.139,说明不同家庭收入的农户的机械化程度没有显著性差异。

2、(1)执行analyze->compare means->independent-sample T Test(2)将“效果”移入test variables 框内(3)将“方法”移入grouping variables框内,单击define groups按钮,并在group1和group2框中分别输入有效值,单击continue (4)单击ok数据分析:显著性Sig.=0.128,所以在0.05的显著性水平上,两种激励方法的效果没有有显著差异。

3、(1)执行analyze->compare means->paird sample T Test,将“方案1”“方案3”移入paired variables(2)单击ok(3)以同样的方法比较“方案2”“方案3”数据分析:方案1与方案3的检验中,Sig.=0.044,说明方案1与方案3有显著性差异,所以均值相等的0假设不成立。

spss上机习题附答案

习 题1、 下表为100头某品种猪的血红蛋白含量〔单位:g/100ml 〕资料,试将其整理成次数分布表,并绘制直方图和折线图。

13.4 13.8 14.4 14.7 14.8 14.4 13.9 13.0 13.0 12.8 12.5 12.3 12.1 11.8 11.0 10.1 11.1 10.1 11.6 12.0 12.0 12.7 12.6 13.4 13.5 13.5 14.0 15.0 15.1 14.1 13.5 13.5 13.2 12.7 12.8 16.3 12.1 11.7 11.2 10.5 10.5 11.3 11.8 12.2 12.4 12.8 12.8 13.3 13.6 14.1 14.5 15.2 15.3 14.6 14.2 13.7 13.4 12.9 12.9 12.4 12.3 11.9 11.1 10.7 10.8 11.4 11.5 12.2 12.1 12.8 9.5 12.3 12.5 12.7 13.0 13.1 13.9 14.2 14.9 12.4 13.1 12.5 12.7 12.0 12.4 11.6 11.5 10.9 11.1 11.6 12.6 13.2 13.8 14.1 14.7 15.6 15.7 14.7 14.0 13.9(提示:第一组下限取为9.1,组距i =0.7)2、 测得某肉品的化学成分的百分比方下〔单位:%〕,请绘制成圆图。

水 分 蛋白质 脂 肪 无机盐 其 它 62.0 15.317.21.83.73、 2001年调查四川省5个县奶牛的增长状况〔及2000年相比〕得如下资料〔单位:%〕,请绘成长条图。

双流县 名山县 宣汉县 青川县 泸定县 增长率〔%〕 22.613.818.231.39.54、 1-9周龄大型肉鸭杂交组合GW 和GY 的料肉比方下表所示,请绘制成线图。

周龄 1 2 3 4 5 6 7 8 9 GW 1.42 1.56 1.66 1.84 2.13 2.48 2.83 3.11 3.48 GY 1.471.711.801.972.312.913.023.293.57习 题1、随机抽测了10只兔的直肠温度,其数据为:38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4〔℃〕,确定该品种兔直肠温度的总体平均数0μ=39.5〔℃〕,试检验该样本平均温度及0μ是否存在显著差异?〔=t2.641 0.01<P <0.05〕2、11只60日龄的雄鼠在x 射线照射前后之体重数据见下表〔单位:g 〕:检验雄鼠在照射x 射线前后体重差异是否显著?〔=t 4.132 P <0.01〕3、某猪场从10窝大白猪的仔猪中,每窝抽出性别一样、体重接近的仔猪2头,将每窝两头仔猪随机地支配到两个饲料组,进展饲料比照试验,试验时间30天,增重结果见下表。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、作业分析
案例背景:拟分析导致急救后颅脑损伤的主要影响因素,某省医院的外科
医生收集了2003-2005年间在该科室进行过急救治疗的脑外伤病例共201例。

研究目的:差异性比较
资料类型:本例根据是否出现迟发性脑损伤将数据分为两个独立样本。

本例的数据变量有性别、年龄、入院时血循环指标、入院时症状、入院时
意识程度、是否手术急救、其它治疗、是否出现迟发性脑损伤。

在这些变量中
既有连续变量又有分类变量,所以在检验时需分成两种:定量检验与定性检验。

其中定量检验为:年龄、入院时血循环指标;定性检验为:性别、入院时
症状、入院时意识程度、是否手术急救、其它治疗。

二、数据描述
1 数量变量的描述
利用SPSS软件分析→描述统计→描述,将年龄、收缩压、舒张压、血小
板拖入,得到下表:
通过表格可以发现血小板的极差为372,标准差为63.568.极差和标准差都较大,通过求自然对数来减小标准差,所以我们改用血小板的自然对数为数据。

得到下表:
2.分类变量的描述
利用SPSS软件分析→表→设定表,选中性别、脑挫伤、中线移位、脑肿胀、意识程度、手术、止血药、激素、脱水剂拖入框中,得到下表:
从表中可以大致看出,脑挫伤、手术、中线移位、意识程度、激素和脱水剂几个变量和是否发生脑损伤有关。

但是,这些关联是否具有统计学意义还需要进行检验。

三、差异性比较
1数量变量的差异性比较
(1)年龄与迟发性脑损伤的关系
本案例为两独立样本,我们对其进行正态性检验。

利用SPSS软件分析→统计描述→探索,得到下表:
从表中,可得出年龄成正态性分布。

利用SPSS软件分析→比较均值→独立样本T检验,检验变量为年龄,分组变量为迟发性脑损伤,单击确定得到如下结果:
发生迟发性脑损伤与未发生迟发性脑损伤组中年龄均服从正态分布,两总体方差齐。

采用两独立样本的t检验:t=-1.038,df=199,P=0.300,可以得出,以
α=0.05为检验水准,年龄与是否发生迟发性脑损伤无明显差异。

(2)收缩压、舒张压与迟发性脑损伤的关系
与上述方式相同,对数据进行正态性检验,检验结果为:
从表中,可得出收缩压与舒张压成正态分布,血小板数自然对数值成正偏态分布。

对数据进行方差齐性检验,得到下图:
由于P值都小于0.05,则方差不齐。

对数据进行t‘检验。

利用SPSS软件对收缩压和舒张压进行独立样本T检验得到以下结果:
从表中,可以得出收缩压、舒张压与是否发生迟发性脑损伤差异有统计学
意义。

(3)血小板自然对数值与迟发性脑损伤的关系
血小板自然对数值成正偏态分布,所以采用秩和检验来进行差异性检验。

利用SPSS软件分析→非参数检验→两个独立样本,检验变量为血小板,
分组变量为迟发性脑损伤,单击确定得到如下结果:
由于数据不来自正态分布总体,所以采用两独立样本的Mann-Whitney检验。

结果显示:Mann-WhitneyU=712.5,P≈0.000,按α=0.05的检验标准,差异有
统计学意义。

2分类变量的差异性比较
下面我们队各影响因素对迟发性脑损伤的作用进行考察,对于性别、激素
等分类变量,我们应依次进行卡方检验。

利用SPSS软件分析→描述统计→交叉表,将性别、脑挫伤、中线移位、
脑肿胀、意识程度、手术、止血药、激素、脱水剂拖入列,迟发性脑损伤拖入行。

在统计量中选择卡方检验,点击确定,下表为性别的卡方检验:
卡方检验结果显示P=0.466,则按α=0.05,差异无统计学意义,不能认为
性别与发生迟发性脑损伤有关。

将各个分变量汇总为下表:
根据表格数据显示,中线移位、意识程度、止血药、激素、脱水剂这些变
量的检验P值较小,对发生迟发性脑损伤可能有影响。

四、研究结果
通过对数据中变量的定性分析和定量分析,可以初步得出收缩压、舒张压、血小板、中线移位、意识程度、止血药、激素、脱水剂这些变量对是否发生迟
发性脑损伤可能有影响。

相关文档
最新文档