spss数分大作业北交大

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二题:利用居民储蓄调查数据,从中随机选取75%的样本,进行分析,实现以下目标:

1、分析不同户口储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格;

2、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度;

3 、分析储户一次存款金额的分布,并检验储户的一次存款金额的均值为4500元, 是否可信?

基本思路

由于本题只需要“从中随机选取75%的样本,进行分析”,所以需要用到数据选取一项。数据选取的方式很多,依本题思路看,属于随机抽样即近似抽样和精确抽样。

操作步骤

数据--选择个案--随机个案样本,点开下面的样本--大约个案填写75%

结果

结果的解释和结论

其中会多出生成一个名为filter_$的新变量,取值为1或0。1表示本个案被选中,0表示未被选中。该变量是SPSS产生的中间变量,如果删除它则自动取消样本抽样。

1、分析不同户口储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格;基本思路

首先进行多选项分析,对多选项变量集进行频数分析;对不同职业储户储蓄目的进行分析,采用多选项交叉分组下的频数分析

操作步骤

分析---描述统计---交叉表---行选择目的一,列选择户口,勾选显示条形图和取消表格。

结果

结果分析:从条形图来看,

城市户口的人比农村户口的人购买能力强,二者在正常生活零用方面花费最大。其次,城市人口的花销重心还在买高档消费商品和结婚用品上,说明城镇户口的生活水平高。

2.分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度

基本思路:该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。

操作步骤:分析→描述统计→交叉表,显示复式条形图前打勾,行选择户口,列选择未来收入情况,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认

果:

结果解释和结论:),对应的自由度为3(df=3),显著性水平值为0.021<0.05,故可认为实际次数与理论次数有差异。因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势”持不同的态度。

3 、分析储户一次存款金额的分布,并检验储户的一次存款金额的均值为4500元, 是否可信?

基本思路:由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。

操作步骤:转换→重新编码为不同变量→选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。再分析→描述统计→频率→变量:存款金额分组,图表选择直方图,选择显示正态曲线。

结果

思路:以“户口”将数据进行拆分,然后用总体

均值的检验以95%的置信度来检验“城镇居民一次存款金额的均值为4500元”是否可信。操作:数据-拆分文件-户口-分析-比较均值-单样本t检验-存取款金额-检验值4500

分析:存款在500以下所占百分比最大,有34.6%,其次是500-1000的人数。而存款在5000以上的也有19.9%,说明存款数额悬殊较大。由上面的表格可以知道,因为sig为0.510.和0.842大于0.025,拒绝H0,所以“城镇居民一次存款金额的均值为4500元”不可信。

第五题某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:

(1)给出SPSS数据集的格式(列举前4个样本即可);

(2)销售方式对销售量的影响;

(3)销售方式和销售地点以及它们的交互作用对销售量的影响。

某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:

基本思路:本道题重点考察我们对于在SPSS 应用过程中对于方差分析的应用情况。先将这组数据输入SPSS,然后进行两个方面的计算:单因素方差分析和多因素方差分析。利用SPSS 的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。

多重比较检验的方法: LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey 方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。

1.给出SPSS数据集的格式(列举前4个样本即可);

操作:分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据

2.销售方式对销售量的影响

操作步骤:分析-比较均值-单因素ANOVA

结果:

分析:后面的sig是p值,根据0.05的置信度,F1-α(k-1, n-k)=1/F0.05(36,3 )=0.12F> F1-α(k-1, n-k)得到F=13.244 。显著性0.000<0.05说明拒绝原假设(销售方式对销售量无

显著性影响),证明销售方式对销售量有显著性影响。

3.销售方式和销售地点以及它们的交互作用对销售量的影响

操作步骤:分析-一般线性模型-单变量-因变量:收率,固定因子

结果

结果分析:第一个表中是各自变量的水平数,销售方式的水平数为4,分别为……,每个水平36个案例;地区的水平数位8,每个水平8个案例。

根据表二的双因子方差分析结果得到:

F A=23.175 F B=6.459 F AB=1.153

X1,x2,x1*x2的P值分别为0.000,0.000.0.286.只有X1*X2的P值大于0.05.在a=0,05的显著水平下,因子A和B是显著的,即销售方式、销售地点对结果有显著影响,而它们的交互作用对结果没有显著作用。

第八题以高校科研研究数据为例,建立回归方程研究。以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X3、论文数X7、获奖数X8。

基本思路:

使用回归分析方法来分析事物之间的统计关系

侧重

考察

变量

之间

的数

量变

化规

并通

相关文档
最新文档