回归分析实验报告

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验报告

实验名称:数据整理与分析

相关分析实验报告实验课程:统计学

数据的整理与分析

一、实验目的:

学会运用Excel中次数分布表、透视表、统计图以及描述性统计功能来分析一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。

二、实验原理:

次数分布表的制作过程,第一步找出最大、最小值,确定全距R;第二步利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。数据透视表,选中当前数据库表中人一个单元格,单击菜单中的“数据”—“数据透视表与数据透视图”。直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴根据次数的高度表示各组次数绘制成的统计图。折线图是在直方图的基础上,用折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相连。

三、实验环境:

实验地点:实训楼计算机实验中心五楼实验室3

试验时间:第五周周二

实验软件:Microsoft Excel 2003

四、实验内容

1、(1)在数据源中选取所需数据,对数据进行分析。利用Excel 对数据进行描述性统计分析。实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。

(2)数据资料:

数据来源“9-33 各地区农村居民家庭平均每人主要食品消费量(2008年)”如下图所示。

2、实验步骤

第一步:在数据库中把所要研究的数据对象复制黏贴到新建的Excel工作表sheet1中。我要研究的是“各地区农村居民家庭平均每人主要食品消

费量 (2008年)”挑选了其中的蔬菜。

第二步:对sheet2中的数据进行分组。

(1)找出这31个数据中的最大、最小值,得到全距R

(2)其次利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距i;

(3)然后分组,根据分组标志和分组上限确定在组内数据的频数以及频率

(4)最后得到全国各地区蔬菜消费量的次数分布表。

第三步:数据分析

(1)在Excel表工具栏中点开“加载宏”—“分析工具库”确认(如图);

(2)再次打开工具栏“数据分析”—“描述统计”确定,得到对该组数据的描述性统计数据。

以下截图为部分实验步骤:

图1.1

图1.2

图1.3

图1.4

图1.5

图1.6

图1.7

图1.8

图1.9

图1.10

图1.11

图1.12

图1.13

图1.14

图1.15

图1.16

五、实验结果:

这次的实验是运用Excel的统计分析功能,进行数据的搜集整理和显示.并进

行统计数据的录入、分组、汇总及各种常用统计图表的绘制,让我对数据的整理有了更深层次的理解,从而在有限经验样本的基础上实现对总体或现实世界的认识。

先讲述下本次的实验过程。首先是对斯透奇斯公式的计算,m=1+3.322lgN,从以上实验数据中可以得出,N=31,代入公式后得出m=5.95.约等于6.所以组数为6组;组限R=Max-Min=Max(B3:B33)=Min(B3:B33)=162.79-20.57=142.22;组距i=R/m=142.22/6=23.7,所以得出i=25.

其次根据算出来的分组标志进行分组。分成(20~45),(45~70),(70~95),(95~120),(120~145),(145~170)共六个组。根据“上组限不计入的原则”,在下方将每组的最大值一次排列为“44,69,94,119,144,169”.之后依次计算出“各组频数,各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率”。

接下来是FREQUENCY函数的应用。它的用途是以一列垂直数组返回某个区域中数据的频率分布。所以先选中D20:D25区域,然后在菜单栏上面点击“插入”,选择“插入函数”,将或选择类别改成“统计”,选择函数“FREQUENCY”,然后点击确定。在Data array中填入B:B,在Bins array中填入E13:E18。则各组数据则显示出来,将每一列的数据加起来,看看是否与题目总提供的个数相同,确实为31.以此类推,将各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率均填写完整。

再次,点击“工具-加载宏-勾选分析数据库-确定”,然后,点击“工具-数据分析”,然后在数据分析中选择“描述统计”,点确定。将31个原始数据,输入到工作表中的B3:B33。然后步骤如下:第1步:选择“工具”下拉菜单。第2步:选择“数据分析”选项。第3步:在分析工具中选择“描述统计”。第4步:当出现对话框时,在“输入区域”方框内键入B3:B33;在“输出选项”中选择输出区域(在此选择“新工作表”);选择“汇总统计”(该选项给出全部描述统计量);选择“确定”最后得出这31个数的平均数92.4994,中位数93.85.标准差为34.269,方差1174.354等一系列数据。

六、实验结果分析(运用理论分析实验结果)

在这一组实验数据中,蔬菜的最大产量为162.79千克,最小为20.57千克,而平均值为92.4994千克,所以用平均值分析离散趋势还是不准确的。他不能准确估计平均水品,也让我们判断出不同地区的实际差距还是很大的。

这个应该与各个地区的气候地域、环境是密切相关的,比如辽宁,这是一个土地肥沃适合农产种植的地方,而且近年来辽宁省很多地方农村采用保护地生产(以日光温室和大中小棚生产为主)与露地蔬菜栽培相结合的技术措施,一年四季均可栽培蔬菜,并获得优质高产,增加农民收入,满足城市居民蔬菜需求。那该地区的蔬菜人均消费量当然大大提高。而相对于那些土地贫瘠,农业生产相对资源不足,只能以拓展畜牧业为生的地区,人均蔬菜消费量肯定很低。而住在牧区的人他们吃得东西主要是藏族传统食物,在牧区的帐篷里,你才有机会吃到最好的酥油,最棒的酸奶.有些地理环境艰苦地方的牧民一年内可能吃得蔬菜很有限。

然后在这组数据中中位数是第16个数,这就说明大部分地区消费量还是比较少,这就是因为各地之间的经济水平,蔬菜的产量不同而决定。要增加各个地区人均蔬菜消费量的话,除了积极开发当地的经济水平,多多调节南北之间的物资,还应多依靠科学技术,增加产量。

7 结论 (验证理论、新发现、体会)

在本次实验过程中,首先进行的就是对统计数据的输入与分析。这个输入过程并不轻松,既要细心又要用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。因此,输入正确的数据也就成为了整个统计实验的基础。

数据输入后就是统计数据的描述与分析,这是整个统计实验关键中的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分析,抽样分析,方差分析,图形描述等则更具体和深刻的向我们揭示了统计数据的内在规律性。

在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。所以EXCEL是我们统计试验的基础知识。若不知EXCEL的运用则无法进行试验。

这一次的统计学实验是我大学生活中不可或缺的重要经历,它对我的学习以及将来工作生活中都有很大的帮助。其一,我可以将自己所学的知识应用于实践

相关文档
最新文档