数据的基本统计与非参数检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

北京建筑大学理学院信息与计算科学专业实验报告

课程名称《数据分析》实验名称数据的基本统计与非参数检验实验地点基C-423 日期 2016 . 3 .17

姓名班级学号指导教师成绩

【实验目的】

(1)熟悉数据的基本统计与非参数检验分析方法;

(2)熟悉撰写数据分析报告的方法;

(3)熟悉常用的数据分析软件SPSS。

【实验要求】

根据各个题目的具体要求,完成实验报告

【实验内容】

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别对数据的“家庭收入”、“现住面积”,进行数据的基本统计量分析,撰写相应的分析报告;

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别分析不同学历对家庭收入、现住面积是否有显着影响,撰写相应的分析报告。

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析家

庭收入与10000元是否有显着差异,撰写相应的分析报告。

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析婚姻状况对家现住面积是否有显着影响,撰写相应的分析报告。

根据附件“减肥茶数据”给出的相关数据,请选用恰当的分析方法,分析该减肥茶对减肥是否有显着影响,撰写相应的分析报告。

【分析报告】

1.

表一家庭收入和现住面积的基本描述统

计量

家庭收入现住面

N有效29932993缺失00均值

均值的标准误.47349中值

众数

标准差

方差

偏度.910偏度的标准误.045.045峰度

峰度的标准误.089.089

百分位数25 50 75

表一说明,

家庭收入方面:

被调查者中家庭收入的均值为元,中值为15000元,普遍收入为10000元;

家庭收入的标准差和方差都相对较大,所以,各家庭收入之间有明显的差异;

偏度大于零,说明右偏;峰度大于零,说明数据呈尖峰分布;

由家庭收入的四分位数可知,25%的家庭,收入在10000以下,有50%的家庭,收入在15000以下,有75%的家庭,收入在20000以下;

现住面积方面:

表二:学历与现住面积的交叉表

被调查者中现住面积的均值为平方米,中值为60平方米,普遍面积为60平方米;

现住面积的标准差和方差都相对较大,所以,各家庭现住面积之间有明显的差异;

偏度近似等于零,说明现住面积数据对称分布;峰度大于零,说明现住面积数据为尖峰分布;

由现住面积的四分位数可知,25%的家庭,现住面积为45平方米以下,有50%的家庭,现住面积在60平方米以下,有75%的家庭,现住面积在80平方米以下。

图一:家庭收入直方图

该图表明,家庭收入分布存在一定的右偏。

图二:现住面积直方图

该图形象的展示了现住面积的数据分布比标准正态分布更陡峭。

new

总计

文化程度

初中及以下 计数 796 8 1 0

805

预期计数

文化程度 内的 %

%

% % % % %

new 内的 % %

% % % % %

占总计的百分

比 %

% % % % %

残差

标准残差

.6

高中(中专) 计数 1240

17 1 0 0 1258

预期计数

文化程度 内

的 %

%

% % % % %

new 内的 %

%

% % % % %

占总计的百分

%%%%%%

残差

标准残差.6

大学(专、本科)计数83251544896

预期计数

文化程度内

%%%%%%

的 %

new 内的 %%%%%%%

占总计的百分

%%%%%%

残差

标准残差

研究生及以上计数29310134

预期计数.9.1.0.1

文化程度内

%%%%%%

的 %

new 内的 %%%%%%%

占总计的百分

%%%%%%

残差.9.0.9

标准残差

总计计数2897798452993

预期计数

文化程度内

%%%%%%

的 %

new 内的 %%%%%%%

占总计的百分

%%%%%%

图三:学历与家庭收入直方图

表二表明:

首先,在所调查的2993个样本中,805个样本为初中及以下学历,1258为高中(中专)学历,896为大学(专,本科)学历,34为研究生及以上学历,分别占总

样本的%,42%,%,和%,可见高中学历居多;收入为0~5w,

5w~10w,10w~15w,15w~20w,20w~25w的样本量分别为2897,79,8,4,5,各占样本

的%,%,%,%,%,收入在0~5w的占较大比例。

其次,对不同学历进行分析。在初中及以下学历中,%的家庭收入在5万以下,1%的家庭收入在5w~10w之间;在高中学历中%的家庭收入在5万以下,%的家庭收入在5w~10w之间;在大学学历中%的家庭收入在5万以下,%的在5w~10w之间;在研究生及以上学历中%的家庭收入在5万以下,%的家庭收入在5w~10w,%的家庭收入在10w~15w之间。

最后,对家庭收入进行分析。在家庭收入为5w(2897)以下的样本中,学历为研究生及以上学历的最少,为29;其他家庭收入中,大学学历的占大多数。由此可以得出,学历与家庭收入有一定的联系。但是,样本中的各学历的样本量存在一定的悬殊。

这些结论从图中可以直观的展现出来。

表三:不同学历的家庭收入的一致性检验结果

数值df 渐近显着性(2 端)

皮尔森

(Pearson) 卡方

12.000概似比12.000线性对线性关联1.000有效观察值个数2993

相关文档
最新文档