spss统计软件期末作业

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三题:

解:选取85%的样本:数据———>选择个案———>随机个案样本———>大约85%

(1)思路:先按储蓄目的分组,再对户口进行拆分,最后做频率统计

步骤:先按储蓄目的分组:转换,重新编码为其他变量,选中目的一,输出变量名称设为“储蓄目的分组”,点击更改,新值与旧值,按1———>1,2———>2······这样设置完成,继续,最后确定。

对户口进行拆分:数据,拆分文件,比较组,选中户口,确定。

频率分析:分析,描述分析,频率,选入目的一,将图表设为条形图,然后点击确定。

输出结果如下:

分析:从表格中,我们能够看见城镇户

口和农村户口的储户的不同储蓄目的所占百分比数量,而从条形图上我们能够更直观的看见各种百分比的高低多少。

取消拆分文件操作。

(2)思路:该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。

步骤:分析,描述分析,交叉表,行设为户口,列设为未来收入情况,

点击确定,得到下表:

分析:原假设是:城镇和农村储户对“未来收入状况的变化趋势”持相同的态度,由于卡方检验中,p=0.017<0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,即城镇储户和农村储户有不同的态度。

(3)思路:数据分组,将存(取)款金额重新分成五组,五组区间分布为,少于500元,500-2000元,2000-3500元,3500-5000元,5000元以上。分组后进行频数分析并绘制带正态曲线的直方图。

利用SPSS的频数分析计算所有样本的存(取)款金额的四分位数;然后,按照年龄段对数据进行拆分(Split file)并重新计算分位数,分别得到不同年龄段的储户的存(取)款金额的四分位数。

步骤:转换,重新编码为其他变量,选中存(取)款金额,名称设为“存款金额分组”,更改,旧值与新值按如下设置

继续,确定。

分析,描叙分析,频率,选中存款金额分组,图标,直方图,在直方图上显示正态曲线。继续,确定。得图如下:

数据,拆分文件,选取年龄,比较组,确定。

分析,描述分析,频率,选取存(取)款金额,统计量———>四分位,继续,确定。如下图:

得到结果如下:

分析:分位数是变量在不同分位点上的取值。分位点在0-100之间,四分位即是各年龄段的储户的存款金额在0,25%,50%,75%,100%各点的取值,从表中中可以清晰地看见各年龄段的差异。

第十一题:

思路:先选择出从1981年至2000年的数据,然后绘制教育支出和年人均可支配收入两者的散点图,观察散点图发现两变量之间呈非线性关系,再尝试选择二次、三次曲线、复合函数和幂函数,指数函数模型,利用曲线估计进行本质线性模型分析。其中,教育支出为被解释变量,年人均可支配收入为解释变量。

步骤:数据,选择个案,基于时间或个案全距,从第4到第23个个案,

绘制散点图:图形,旧对话框,散点/点状,简单分布,将Y变量设为教育支出,X变量设为年人均可支配收入。确定,得到如下图形:

分析:从上图中,可以看出,该图可能是二次,三次,指数,幂函数,复合函数的图像,故作曲线拟合。

曲线拟合:分析,回归,曲线估计,按如下设置好对话框,

点击确定,得如下图形:

分析:SPSS自动完成模型的参数估计,并输出回归方程显著性检验的F值和概率p值、判定系数R2等统计量。根据“模型汇总和参数估计值”表格,可以判断出各种曲线与散点图的拟合程度(匹配程度),比较R方和F的值来看,复合函数和指数函数的拟合度最高。观察曲线图,可以清楚地看出,拟合程度最好的也是指数函数和复合函数,两者都已经重合为一条曲线了。

第十二题:

思路:先将数据输入(变量视图定义变量,再用数据视图输入数据),根据

所得数据进行K—Means聚类分析。数据输入:(1)定义变量

(2)输入数据:

K—Means聚类分析:

(1)指定聚类数目K

(2)有系统默认K个初始聚类中心

(3)根据距离最近原则进行分类

(4)重新确定K个类中心

分析,分类,K—均值聚类,然后按如下操作

分别点击迭代,保存,选项得到上面的三个会话框,按照会话框设置。完成上述操作后,确定,得到以下的图表:

分析:初始聚类中心表:第二类的各指数几乎都是最有的,第一类次之,第三类最不理想。

迭代历史记录:展示3个类中心每次迭代时的偏移情况。

最终聚类中心:展示第二类几乎各指数依然都是最有的,第一类次之,第三类还是

最不理想的。

ANOVA :展示物理,语文,历史,英语的指数的均值在3类中的差异是显著的,而数

学与化学并不显著。

每个聚类中的案例数:展示三个类的成员情况。

第五题:

(1)

思路及步骤: 定义一个分组变量为g roup1 ( 即在变量视图 中/名称列中的第一行输入g roup1,并设置小数的值为0) , 该变量表示因子A 的3 个不同水平, 其值1, 2, 3 分别表示A 1 , A 2 ,A 3 . 定义一个变量为data ( 即在变量视图中名称列中的第二行输入data) , 定义另一个分组变量为g roup2 ( 即在变量视图中名称列中的第三行输入g roup2, 并设置小数的值为0) ,该变量表示因子B 的四个不同水平, 其值1, 2, 3, 4 分别表示B 1 , B 2 , B 3 , B 4 . 按照行的顺序( 即先输入A 1 行的数据, 然后输入A 2 行的数据, 依此类推) 依次输入SPSS

相关文档
最新文档