北交大数分统计学大作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数分大作业
第3题:基本统计分析3利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:
1. 分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;
2.分析不同年龄的储户对什么合算的认同是否一致。
3.检验城镇储户的一次存款金额的均值为5000元, 是否可信?
•利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:
•基本思路:首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。
•操作步骤:选择菜单→数据→选择个案→随机个案样本,样本尺寸填大约所有个案85%
1.分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;基本思路:
(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。
(2)进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。
操作步骤:转换→重新编码为不同变量→选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。再分析→描述统计→频率→变量:存款金额分组,图表选择直方图,选择显示正态曲线
。
步骤:数据→拆分文件→分组方式:户口→确定。分析→描述统计→频率→统计量→四分位数前打勾→确定。
存款金额分组
频率百分比有效百分
比
累积百分比
有效1.00 87 35.4 35.4 35.4
2.00 76 30.9 30.9 66.3
3.00 14 5.7 5.7 72.0
4.00 20 8.1 8.1 80.1
5.00 49 19.9 19.9 100.0
存款在500以下所占百分比最大,有35.4%,其次是500-1000的人数。而存款在5000以上的也有19.9%,说明存款数额悬殊较大。
从输出图表中看出城镇储户较农村储户有两倍之多,可能是因为城镇居民比较富裕而且存款意识比较强。农村户口的居民可能更愿意把钱藏在家里而不是拿到银行去存。
2.分析不同年龄的储户对什么合算的认同是否一致。
基本思路:该问题列联表的行变量为年龄,列变量为什么合算,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对不同年龄的储户对什么合算的认同是否一致进行分析.
操作步骤:分析→描述统计→交叉表,显示复式条形图前打勾,行选择年龄,列选择什么合算,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。
分析:因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,年龄对什么合算的认同有影响,说明不同年龄的储户对什么合算的认同不一致.
3.检验城镇储户的一次存款金额的均值为5000元, 是否可信?
由上表可知,城镇储户的一次存款金额的均值为5000元, 不可信.
第5题:方差分析2某电器公司想知道某产品销售量与销售方式及销售地点是否有关,
根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:
(1)给出SPSS数据集的格式(列举前4个样本即可);
(2)销售方式对销售量的影响;
(3)销售方式和销售地点以及它们的交互作用对销售量的影响。
•某电器公司想知道某产品销售量与销售方式及销售地点是否有关,根据近2个月的情况得到下表的数据,以0.05的显著性水平进行检验:
(1)给出SPSS数据集的格式(列举前4个样本即可);
(2)销售方式对销售量的影响;
(3)销售方式和销售地点以及它们的交互作用对销售量的影响。
基本思路:本道题重点考察我们对于在SPSS 应用过程中对于方差分析的应用情况。先将这组数据输入SPSS,然后进行两个方面的计算:单因素方差分析和多因素方差分析。利用SPSS 的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。
(1)操作步骤:分别定义分组变量A(方式)、X(销售量)、B(地区),
在变量视图与数据视图中输入表格数据
(2)销售方式对销售量无显著性影响
结果分析:显著性<0.05说明拒绝原假设(销售方式对销售量无显著性影响),证明销售方式对销售量有显著性影响。
主体间效应的检验
因变量: X
源III 型平方
和
df 均方 F Sig.
校正模型2211.900a19 116.416 20.072 .000
截距269288.100 1 269288.100 46428.983 .000
A 1221.300 3 407.100 70.190 .000
B 269.650 4 67.412 11.623 .000
A *
B 720.950 12 60.079 10.358 .000
误差116.000 20 5.800
总计271616.000 40
校正的总
计
2327.900 39
a. R 方 = .950(调整 R 方 = .903)
密性。
7.以高校科研研究数据为例,建立回归方程研究
以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、论文数X7。
解释变量采用(强制)进入策略,对回归方程和回归系数的显著性检验结果进行解释分析,并给出最终的回归模型(=0.05) 。
以高校科研研究数据为例,建立回归方程研究
•以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、论文数X7。
•解释变量采用(强制)进入策略,对回归方程和回归系数的显著性检验结果进行解释分析,并给出最终的回归模型( =0.05) 。
•步骤:菜单分析回归线性。统计量选择回归系数估计,置信区间95%
模型汇总
模型R R 方调整 R
方标准估计的
误差
1 .966a.933 .923 232.3360
a. 预测变量: (常量), 论文数, 投入科研事业费(百
元), 专著数, 投入人年数。
Anova a
模型平方和df 均方 F Sig.
1 回归.276 4 4918332.319 91.114 .000b 残差1403480.724 26 53980.028
总计.000 30