(整理)数据整理与数据分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验1 数据整理与数据分析

1.1 数据整理

一、实验目的和要求:

能熟练的进行统计数据的录入、分组、汇总及各种常用统计图表的绘制。

二、实验内容:

1、数据的录入

2、数据的排序

3、数据的分组

4、数据透视分析

5、常用统计图表的绘制

三、统计函数

频数分布函数(FREQUENCY)的语法形式为:

FREQUENCY(data_array,bins_array)

其中:Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。

四、实验步骤:

1、数据的录入

数据的录入是指把调查得到的结果输入到一张叫数据清单的EXCEL工作表中。数据清单是指包含相关数据的一系列工作表的数据行,如发货单数据库,或一组客户名称和联系电话。数据清单可以作为数据库使用,其中行表示记录,列表示字段。

例某集团公司欲在某地区投资于医疗卫生事业,为了减少风险,获得利润,该集团企划部门决定先了解一下市场潜力。企划部王经理随机访问了该地区几家医院中就医的36名患者,询问其等候看病的时间,根据这些数据,王经理会得到什么信息呢?打开EXCEL工作表,在列中输入数据的名称,称为变量。然后依次输入相应调查数据。

2、数据的排序

①打开“数据整理.xls” 工作簿,选定“等候时间”工作表。

②利用鼠标选定单元格A1:B37区域

③在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。

④在排序对话框窗口中,选择“主要关键字”列表中的“等候时间”作为排序关键字,并选择按“递增”排序。由于所选取数据中已经包含标题,所以在“当前数据清单”中选择“有标题行”,然后单击“确定”按钮,即可得到排序的结果。

在数据清单中使用分类汇总的方法如下:

先选择需要分类汇总的数据区域A1:B37,然后选择“数据”菜单中的“分类汇总”选项,则打开“分类汇总”对话框。在“分类字段”的下拉式列表中选择要进行分类的列标题,在“汇总方式”的下拉式列表中选择行汇总的方式,本例中选择按“等候时间”进行分类,

选择按“计数”进行汇总,单击“确定”按钮,便得到分类汇总的结果。在对数据进行了分类汇总之后,可以观察到等候时间为1分钟的人次为1,等候时间为3分钟的人次为2等等。

尽管分类汇总可以给出各个数值所出现的次数,但从这些次数中还是无法得出其数据分布的规律性。这是因为没有将数值相近的数据进行合并,因而不能理想地抽象概括现象的数量特征。

3、数据的分组

利用Excel频数分布函数进行分组建立频数分布的步骤为:先对数据进行排序,以了解全部数据的变动范围;然后选择全部数据的分组组数;再确定分组的组限,最后对各组数值所出现的频数进行计数。

①打开“数据整理.xls”工作簿,选择“等候时间”工作表。

②在单元格C2中输入“分组”,在单元格D2中输入“频数”。

③在C3:C8区域中依次输入10,20,30,40,50,60,作为频数接受区域,它们分别表明等时间在10分钟以下的人数,等候时间在10分钟以上,20分钟以下的人数等。

④选定D3:D8区域,在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框

⑤在“函数分类”列表中选择“统计”,在“函数名”列表中选择“FREQUENCY”,单击“确定”按钮,Excel弹出“频数分布”对话窗口。

⑥在数据区域“Data_array”中输入单元格B2:B37,在数据接受区间Bins_array 中输入单元格C3:C8,在对话窗口中可以看到其相应的频数是6,7,9,8,5,1,0。

⑦由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl +Shift 组合键,同时敲“回车”键,得到频数分布。

练习1:某生活小区80户居民家庭人口数情况:

4 4 2 3 2 3 3 4 3 2 3 4 2 3 3 3

5 2 3 3

2 3 3 4 3 3 2 3 4 3 2 2 3 3 5 4 4 3 2 1

5 1 4 2 2 3 3 4 4 2 3 3 1 5 2 3 3 2 1 4

2 1 2

3 3 3 2 1

4 3 1 2 4 3 3 2 2 1 2 3

在EXCEL中将上述资料录入,并按照家庭人口数进行频数统计。

其次,EXCEL除能进行单变量值(单项分组)的频数统计外,还可以进行组距分组的频数统计。EXCEL的组距分组的频数统计与单项分组的频数统计操作过程大体相同。但在分组时应注意:EXCEL的FREQUENCY函数进行频数统计时采用的是“上限在内”原则,为符合统计分组的“上限不在内”的原则,因此,分组时相邻组的组限不应重合。

例:某生产车间50名工人日加工零件数(单位:个)如下。(数据学生自行录入)

拟对工人生产数据进行如图1-1的C4:C9的组距分组。但是,FREQUENCY函数在分组时,例如120这个数据会被统计在C6组内,与统计分组原则应统计在C7组内相违背,所以,分组时可按D4:D9形式进行,以符合统计分组原则。然后将各组上限列于E4:E9区域内,这时就可以按单项分组时的步骤进行操作。

图1-1

步骤如下:首先,将光标移至F4单元格,按住鼠标左键,拖曳光标覆盖F4:F9区域(如图1-2所示)。点击EXCEL插入菜单中“函数”选项,在“统计”类函数

图1-2

中选择“FREQUENCY”函数(如图1-3所示)。在“Data-array”中输入原始数据阵列“B4:B53”,在“Bins-array”中输入分组组距阵列“E4:E9”(如图1-3所示)。然后同时按“Ctrl-Shift-Enter”键即得如图1-4所示频数统计结果。

相关文档
最新文档