SPSS作业

合集下载

SPSS作业2

SPSS作业2

二.
1〕.试录入以下数据文件,保存为“数据1.sav”。

2〕.试录入以下数据文件,保存为“数据2.sav”。

3〕.试将数据2合并到数据1,合并后的数据文件另存为“数据3.sav”。

4〕.将工资进行重编码,2000以下〔含2000〕为1,2000-3000为2,3000-4000为 3,4000以上为4,重编码的结果保存为“工资等级”。

新数据文件保存为“数据4.sav”。

5〕.求出各职工刚进入公司时的年龄,保存为“初入年龄”。

新数据文件保存为“数据5.sav”。

6〕.试按各职员的工资数进行排秩,排秩要求工资最高的排为第一,相同数额取平均等级。

排秩后的数据文件保存为“数据6.sav”。

7〕.试按各职员的工资数分性别进行排序,要求先排男性,后排女性。

同一性别按工资从高到低排列。

排序后的数据文件保存为“数据7.sav”。

8〕.试寻找一个新数据文件,将其中一些新变量合并到数据文件7中,合并后的新数据文件保存为“数据8.sav”。

工作文档SPSS第六章作业

工作文档SPSS第六章作业

第六章习题习题6-4.1、问题分析:分析题目中的数据,发现影响用力肺活量的控制变量只有一个,即组别,则采取单因素方差分析进行分析数据。

2、整理数据,将数据分成两列,一列为肺活量,一为组别,进行单因素方差分析,简要步骤为:Analyze -->Compare Means -->One-Way ANOVA -->Options-->Post Hoc-->Contrast3、结果分析:根据上述步骤,整理得出如下数据:1)关于方差是否相等的检验结果及相伴概率值表格1:检验方差是否相等的相伴概率值根据数据得出,相伴概率值大于0.05,可以认为各个组总体方差是相等的,符合方差分析的前提条件,这组数据适合进行单因素方差分析。

2)关于组别之间的显著性差异的大致判断从结果看出,0.000.相伴概率小雨显著性水平0.05,表示拒绝零假设,也就是3个组当中至少有一个组和其他两个组有明显的区别,也可能3个组之间都存在显著地区别。

另外,3个组的离差平方和为12.381,其中控制变量不同水平造成的组间平方和为10.919,随机变量造成的组内平方和为1.462,在组间平方和中,能线性解释平方和10.804,不能线性解释平方和为0.115。

3)各组别之间的相互影响大小观察LSD法多重比较的结果得知,3个叙别之间的相伴概率都小雨显著性水平,说明3个组之间都存在显著性差别。

4)各组观察变量均值的折线图:4、结论:三个组矿工之间的用力肺活量存在显著性差别习题6-5.1、问题分析:分析题目中的数据,发现数据适合协方差分析,则采取协方差分析进行分析数据。

零假设:H0:个水平没有显著性差异,若相伴概率小雨0.05,则拒绝零假设2、协方差分析简要步骤为:Analyze -->General Linear Model-->Univariate-->Options-->Model -->Contrast-->Plots3、结果分析:根据上述步骤,整理得出如下数据:1)关于各组个案的个数值表格2:各组个案的个数0 61 6根据数据得出,组别06,组别二的个案数为62)控制变量对观察变量的独立部分作用观察数据得知:相伴概率大于0.05,说明不同治疗方法(不同组别)对病人血压没有造成显著的影响。

SPSS假设检验作业

SPSS假设检验作业

统计作业(假设检验)1、应用SPSS计算下题:已知某炼铁厂的铁水含碳量服从正态分布,在正常情况下,其总体均值为 4.55。

现在测了10炉铁水,其含碳量分别为4.42, 4.38, 4.28, 4.40, 4.42, 4.35, 4.37, 4.52, 4.47, 4.56 ,试问总体均值是否发生了显著变化(α=0.05)?One-Sample Test此题为双侧检验,因此P=0.001<0.025,拒绝H0,所以总体均值发生了显著变化2、文件名:DATA11-01文件说明:从一所学校中抽取27名男女学生身高数据。

变量说明:no: 编号;sex:性别;age:年龄;h:身高;w:体重。

假设该学校身高服从正态分布,请问能否认为该学校学生平均身高为1.57m(α=0.01)。

One-Sample Test此题为双侧检验,P=.003<.005,拒绝H0,所以不能认为该学校学生平均身高为1.57m3、文件名:DATA11-02文件说明:1973年某市测量120名12岁男孩身高资料。

变量说明:height: 12岁男孩身高当显著性水平分别为α=0.05与0.01时,该市12岁男孩平均身高与该地区男孩平均身高(142.3cm)有无显著差异,并说明所得结论的理由。

当α=0.05时One-Sample Statistics此题为双侧检验,因此P=.162>.025,所以该市12岁男孩平均身高与该地区男孩平均身高(142.3cm)无显著差异当α=0.01时One-Sample StatisticsOne-Sample Test此题为双侧检验,因此P=.162>.005,所以该市12岁男孩平均身高与该地区男孩平均身高(142.3cm)无显著差异4、文件名:DATA09-03文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。

spss作业

spss作业

八、上机作业
1、自学报告分析的各项命令。

2、以“职工数据.sav”为例,要求用基本统计分析完成以下任务:(1)求出性别、工资等级的频次分布表,并用工资等级做条形图、饼形图。

表2 性别表
求工资的均值、中位数、众数、最大值、最小值、标准差、四分位数、十分位数,并用工资做带正态曲线的
F r e q u e n c y
表3 工资的各种数值表
平均值 中位数 众数 标准差 峰度 偏度 最小值 最大值 四分位

十分位
数 3130
3100
1800
1073
201
970
1500 5000 1500
1800
F r e q u e n c y
分性别求工资的标准分。

表4 Descriptive Statistics(a)
表5 Descriptive Statistics(a)
3、依据“保险市场调查”数据,对变量q13a、q13b、q13c进行多选项分析,了解人们购买商业养老保险的原因。

①定义多选项变量集
②多选项频数分析
③以工作单位性质(q34)和购买商业养老保险的原因为变量,进行列联表分析。

SPSS操作实验作业1(附答案)

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1)作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。

然而,当代大学生对华夏文明究竟知道多少呢某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。

调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。

调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。

请利用这些资料,分析以下问题。

问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。

问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。

要求:直接导出查看器文件为.doc后打印(导出后不得修改)对分析结果进行说明,另附(手写、打印均可)。

于作业布置后,1周内上交本次作业计入期末成绩答案问题一操作过程1.打开数据文件作业。

同时单击数据浏览窗口的【变量视图】按钮,检查各个变量的数据结构定义是否合理,是否需要修改调整。

2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对话框。

在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。

3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字“5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。

接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。

再单击【继续】按钮,返回【频率】对话框。

4.单击【图表】按钮,勾选【直方图】和【显示正态曲线】复选框,即直方图中附带正态曲线。

再单击【继续】按钮,返回【频率】对话框。

最后,单击【确定】按钮,操作完成。

SPSS简单的练习作业

SPSS简单的练习作业
(3)
在上图中,分别显示了两两广告形式下销售额均值检验的结果。在SPSS中全部采用了LSD方法中的分布标准误,因此各种方法的前两列计算结果完全相同。表中第三列是检验统计量观测值在不同分布中概率值p,可以发现各种方法在检验敏感度上市存在差异的。以报纸广告与其他三种广告形式的两两检验结果为例,如果显著性水平α=0.05,在LSD方法中,报纸广告和广播广告的效果没有显著性差异,p值为0.412,与宣传品和体验均有显著性差异,概率p值分别是0.00,接近和0.021;但是在其他三种方法中,报纸广告只与宣传品广告存在显著性差异,而与体验无显著性差异。表中第一列星号的含义是,在显著性水平α=0.05的情况下,相应两总体的均值存在显著性差异,与第三列的结果相对应。
实验一SPSS的方差分析、相关分析与线性回归分析………………………17
1.单因素方差分析的基本操作……………………………………………17
2.单因素方差分析进一步分析的操作……………………………………18
作业一SPSS数据文件的建立和管理、数据的预处理
实验一SPSS数据文件的建立和管理、数据的预处理
【实验目的】
【实验结果与分析】
以上结果是广告形式对销售额的单因素方差的分析结果。可以看到,观测变量销售额的总离差平方和为26169.306;如果仅考虑“广告形式”单个因素的影响,则销售额总变差中,广告形式可解释的变差为5866.083,抽样误差引起的变差为20303.222,它们的方差(平均变差)分别为1955.361和145.023,相除所得的F统计量的观测值为13.483,对应的概率p值近似为0。如果显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝零假设,认为不同广告形式对销售产生显著影响,它对销售额的影响效应不全为0。

spss 统计分析与应用 作业

spss 统计分析与应用 作业

统计分析与SPSS应用作业目录第一题 (1)第二题 (4)第三题 ................................................................................................................................................第一题:使用的数据文件为自己编辑的workerxinxi.sav 具体data view如下数据属性variable view如下其中sex的value值设定如下renge的value值设定如下jixiao的value值设定如下Frequencies过程的结果:对weight字段用frequencies过程分析的结果如下体重由第一张表可以看出,被调查的工人样本的体重的四分位数分别为:48.2500kg,54.0000kg,63.7500kg。

第二张表可以看出体重的累积分布百分数,有百分之64.3%的工人的体重位于49kg—70kg之间。

表中给出了人格类型和绩效评级的频数表,其中Frequency为频数,Percent为各族频数占总例数的百分比(包括缺失数据),Valid Percent为各组频数占总例数的有效百分比,因为我所选用的工人信息表中没有缺失数据,因此Percent和Valid Percent 字段的值是相同的。

Cumulative Percent为各组频数占总例数的累积百分比。

在有关人格类型分析的表中,可见,大多数工人有传统型或者现实型人格,共有大约67.9%。

在绩效评级分析的表中,可见,大多数人达到了C级以上的绩效评级。

总体而言该公司的绩效评级体制还是合理的。

Descriptive过程的结果对height字段用descriptive过程分析结果如下可看出,被调查的28个样本中,身高最大值为186cm,最小值为152cm,均值为167.82cm,标准误差为7.31337Explore模块分析结果从上两张图中可以看出集中趋势指标、离散趋势指标、分布特征指标和参数估计值等。

spss作业完整版

spss作业完整版

均值比较与样本T检验1、(1)执行Transform—>Replace Missing Varies,将“机械化程度”移入NewVariables中,在Method中选择Mean of nearby points,单击change,单击OK提交系统。

(2)执行analyze->compare means->mean,将“户主年龄”、“文化程度”、“家庭人口”和“家庭总收入”移入 indenpendent List,将“机械化程度”移入dependent list(3)单击options,选择statistics for first layer 下的 anova table and eta, 单击 continue(4)单击ok数据分析:缺失值由3.8代替,所以用无任何机械代替。

年龄:显著性水平Sig.=0.572>0.05,说明不同户主年龄的机械化程度没有显著的差异。

文化程度:显著性水平Sig.=0.453,说明不同文化程度的机械化程度没有显著性差异;家庭人口:Sig.=0.625,说明不同家庭人口数的机械化程度没有显著性差异;家庭总收入:Sig.=0.139,说明不同家庭收入的农户的机械化程度没有显著性差异。

2、(1)执行analyze->compare means->independent-sample T Test(2)将“效果”移入test variables 框内(3)将“方法”移入grouping variables框内,单击define groups按钮,并在group1和group2框中分别输入有效值,单击continue (4)单击ok数据分析:显著性Sig.=0.128,所以在0.05的显著性水平上,两种激励方法的效果没有有显著差异。

3、(1)执行analyze->compare means->paird sample T Test,将“方案1”“方案3”移入paired variables(2)单击ok(3)以同样的方法比较“方案2”“方案3”数据分析:方案1与方案3的检验中,Sig.=0.044,说明方案1与方案3有显著性差异,所以均值相等的0假设不成立。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

物流统计实验作业<一>:试述聚类分析的基本思想以及SPSS操作的基本步骤?系统聚类的基本思想是聚类分析法又称集群分析法,它是研究样品或指标分类问题的一种多元统计方法。

寻找一种能客观反应事物之间亲疏关系或合理评价事物性质相似程度的统计量,然后根据这种统计量和规定的分类准则把事物进行分类。

操作步骤:1. 在SPSS窗口中选择Analyze→Classify→Hierachical Cluster,调出系统聚类分析主界面,并将变量移入Variables框中。

在Cluster栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。

在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。

2. 点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。

这里我们选择系统默认值,点击Continue按钮,返回主界面。

3. 点击Plots,设置结果输出窗口给出的聚类分析统计图。

选中Dendrogram复选框和Icicle栏中的None单选按钮,即只给出聚类树形图,而不给出冰柱图。

单击Continue,返回主界面。

4. 点击Method,设置系统聚类的方法选项。

Cluster Method下拉列表用于指定聚类的方法,包括组间连接法、组内连接法、最近距离法、最远距离法等;Measure栏用于选择对距离和相似性的测度方法;剩下的Transform Values和Transform Measures栏用于选择对原始数据进行标准化的方法。

这里我们仍然均沿用系统默认选项。

单击Continue,返回主界面。

5. 点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新变量。

None表示不保存任何新变量;Single solution表示生成一个分类变量,在其后的矩形框中输入要分成的类数;Range of solutions表示生成多个分类变量。

这里我们选择Range of solutions,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果。

点击Continue,返回主界面。

6. 点击OK按钮,运行系统聚类过程。

<二>:利用2001年全国31个省自治区各类小康和现代化指数的数据,利用K-均值聚类方法对地区进行聚类分析。

并且对SPSS分析的结果进行分析。

文件名为“小康指数.sav”。

31个省市自治区小康和现代化指数的K-Means聚类分析结果(一)这张表展示了3类的初始类中心点的情况。

由表可知第二类各指数均是最优的,第一类次之,第三类各指数最不理想。

31个省市自治区小康和现代化指数的K-Means聚类分析结果(二)表中展示了3个类中心点每次迭代时的偏移情况。

由表可知,第一次迭代后,3个类的中心点分别偏移了24.387,6.307.23.579,第三类中心点偏移最大;第二次迭代后,3个类的中心点的偏移均小于指定的判定标准(0.02),聚类分析结束。

31个省市自治区小康和现代化指数的K-Means聚类分析结果(三)展示了3个类的最终类中心点的情况。

由表可知,第二类各指数均是最优的,第一类次之,第三类各指数最不理想。

31个省市自治区小康和现代化指数的K-Means聚类分析结果(四)表中展示了3个类的类成员情况。

第1类(中游水平)有7个省市自治区,第2类(上游水平)有3个省市自治区,第3类(下游水平)有21个省市自治区。

31个省市自治区小康和现代化指数的K-Means聚类分析结果(五)展示了各指数在不太类的均值比较情况,通过该表可以看出各指数的均值在3类中差异是最著。

31个省市自治区小康和现代化指数的K-Means聚类分析结果(六)<三>:根据“高校科研研究.sav”的数据,利用层次聚类分析对各省市的高校科研情况进行聚类分析。

(1)根据凝聚状态表,利用碎石图对聚类类数进行研究(2)绘制聚类树形图,说明哪些省市聚在一起。

(3)绘制各类科研指标的均值对比图。

(4)利用方差分析方法分析各类在哪些科研指标上存在差异。

凝聚状态表碎石图通过碎石图可以得出:随着类的不断凝聚,类目数的不断减少,类间的距离在逐渐增大。

在聚成7类之前,类距增大的幅度较小,形成极为“陡峭的山峰”,但到3类后,类间的距离迅速增大形成极为“平坦的碎石路”。

根据类间距离小形成类的相似性大,类间距离大形成类的相似性小的原则,可以找到“山脚”下的“拐点”碎石,以它作为确定分类数目的参考。

在本例中,可以考虑聚成3类或4类。

2、31个省市自治区小康和现代化指数的层次聚类分析结果* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *Dendrogram using Average Linkage (Between Groups)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25Label Num +---------+---------+---------+---------+---------+青海 29 ⇩宁夏 30 ⇩▫西藏 26 ⇩▫贵州 24 ⇩▫海南 21 ⇩▫云南 25 ⇩⇳⇩新疆 31 ⇩▫⇔广西 20 ⇩▫⇔甘肃 28 ⇩▫⇔黑龙江 8 ⇩▫⇔重庆 22 ⇩▫▫⇩⇩⇩⇩⇩⇩⇩⇩⇩内蒙 5 ⇩⇔⇔山西 4 ⇩⇔⇔福建 13 ⇩▫⇔⇔安徽 12 ⇩▫⇔⇔吉林 7 ⇩⇳⇩⇔四川 23 ⇩▫⇔陕西 27 ⇩▫⇔河北 3 ⇩▫▫⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩江西 14 ⇩▫⇔⇔天津 2 ⇩▫⇔⇔河南 16 ⇩⇔⇔上海 9 ⇩⇔⇔广东 19 ⇩⇳⇩⇩⇩⇔⇔湖北 17 ⇩⇔⇔⇔辽宁 6 ⇩▫⇩⇔⇔浙江 11 ⇩⇳⇩⇔⇔⇔⇔湖南 18 ⇩▫⇩▫⇩⇩⇩⇩⇩⇔山东 15 ⇩⇩⇩⇔⇔江苏 10 ⇩⇩⇩⇩⇩⇩⇩⇔北京 1 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 由上图可以看出:北京为一类(第1类),天津、河北、由图可知,青海、宁夏、西藏、贵州、海南、云南、新疆、广西、甘肃、黑龙江、重庆、内蒙的相似性较高,较早聚成了一类;山西、福建、安徽、吉林、四川、陕西、河北、江西、天津、河南的相似性较高,较早聚成了一类;上海、广东、湖北的相似性较高,较早聚成了一类。

辽宁、浙江、湖南聚成一类;山东、江苏、北京各自成一类。

若分成3类,则北京自成一类(第1类);上海、广东、湖北、辽宁、浙江、湖南、山东、江苏为一类(第3类);其它的为第二类。

<四>:试述因子分析的基本思想以及SPSS操作的基本步骤?因子分析基本思想:从主成分分析模型和理论入手,用等价性的方法建立因子分析精确模型和理。

通过对变量相关系数矩阵内部结构的研究把变量分组,使得同一组内的变量之间相关性较高,但不同组的变量相关性较低。

每组变量代表一个基本结构,这个基本结构称为公共因子。

对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一变量。

操作步骤1.在SPSS窗口中选择Analyze→Data Reduction→Factor,调出因子分析主界面,并将变量移入Variables 框中。

2. 点击Descriptives按钮,展开相应对话框,见图7.2。

选择Initial solution复选项。

这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。

单击Continue按钮,返回主界面。

3. 点击Extraction按钮,设置因子提取的选项,。

在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。

在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。

在Display栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。

在Extract栏中指定因子提取的数目,有两种设置方法:一种是在Eigenvalues over后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Number of factors后的矩形框中输入要求提取的公因子的数目。

单击Continue按钮,返回主界面。

4.点击Rotation按钮,设置因子旋转的方法。

这里选择Varimax(方差最大旋转),并选择Display栏中的Rotated solution复选框,在输出窗口中显示旋转后的因子载荷阵。

单击Continue按钮,返回主界面5.点击Scores按钮,设置因子得分的选项。

选中Save as variables复选框,将因子得分作为新变量保存在数据文件中。

选中Display factor score coefficient matrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。

单击Continue按钮返回主界面。

6. 单击OK按钮,运行因子分析过程<五>:利用“各地区年平均收入.sav”数据,对全国各地区间年人均收入的差异性和相似性进行研究。

具体需要分析的内容如下:(1)考察原有变量是否适合进行因子分析?(2)提取因子,给出因子分析模型?(3)给出旋转后的因子载荷矩阵,并对因子进行命名解释?(4)给出因子得分函数,计算因子得分?(5)利用因子得分变量对地区进行对比研究?原有变量的相关系数矩阵该表是原有变量的相关系数矩阵。

可以看到:大部分的相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。

因子分析中的变量共同度(一)因子分析中的变量共同度(二)由上面的表可知,表3所有变量的共同度均较高,各个变量的信息丢失都较少。

因此,第二次因子提取的总体效果较理想。

因子载荷矩阵因子分析模型:港澳台经济单位=0.995*F1-0.095*F2集体经济单位= 0.923*F1+0.057*F2外商投资经济单位= 0.911*F1-0.159*F2股份制经济单位= 0.886*F1+0.176*F2国有经济单位= 0.872*F1+0.086*F2联营经济单位= 0.774*F1+0.462*F2其他经济单位= 0.770*F1-0.527*F2旋转后的因子载荷矩阵可知:联营经济单位、股份制经济单位、集体经济单位、国有经济单位在地1个因子上有较高的载荷,第1个个因子主要解释了这几个变量,可解释为内部投资经济单位;其他经济单位、外商投资经济单位、港澳台经济单位在第2个因子上有较高的载荷,第2个因子主要解释了这几个变量,可解释为外来投资经济单位。

相关文档
最新文档