频数分布表的编制举例
案例2编制频数分布表

案例7编制频数分布表并绘制相应的统计图对某地区居民储蓄情况进行调查,所得部分数据见表3-4。
思考与讨论问题:1、编制按户口分组的居民户频数分布表并绘制条形图;2、编制按存取款金额分组的频数分组表并绘制直方图;3、编制户口与存款金额总和、平均数交叉的平面数据透视表;4、编制按户口、存取款金额层叠分组的频数表。
表3-4 居民储蓄调查数据表存取款金额(元) 户口(城镇=1,农村=2) 存取款金额(元) 户口(城镇=1,农村=2)存取款金额(元)户口(城镇=1,农村=2)存取款金额(元) 户口(城镇=1,农村=2)1500 1 3700 1 7000 1 100 1 5000 1 100 2 200 1 10000 1 200 1 100 1 10000 1 2500 1 1000 1 300 1 300 1 3500 1 300 1 600 2 300 1 3 1 6500 1 500 1 2000 1 10 1 18000 1 100 1 500 1 8 1 3200 1 100 1 2000 1 20 1 480 1 50 1 1000 1 5000 1 400 1 100 1 200 1 2400 1 300 1 200 1 5000 1 14800 1 10 1 200 1 500 1 25000 1 6000 1 100 1 100 1 100 1 100 1 300 1 1000 1 5000 1 500 1 100 1 3 1 200 1 1000 1 10000 1 2000 1 30 1 10 1 500 1 300 1 1000 1 200 2 400 1 300 1 200 2 6 1 148 1 5400 1 800 2 10 1 3 1 300 1 40 2 5000 1 10 1 3000 1 500 2 8000 1 150 1 20000 1 60 2 300 2 500 1 23900 2 100 2 1000120011100150023268250001100110002 70001100011000018002 800150150015002 1000110001500014002 1000131300012002 5001600130000130002 10001315000110002 201120021000150002 311000146001102 5190012000282 12001500013501502 10012000110001102 50011000011000152 30013600130015002 20011000150017002 3001300135001502 600220011000151 10001500120018002 301100011000122 80001300011000192 9001500150001142 1000190013000110002 3000011001200120002 60018001900115002 200130016029802 1500110002100025002 70001250001100025002 100011000110000210002 805022100013000252 3110001200252 100110001120282 10001200001800262 312000110021102 9016002100028002 8001100001400212 100012017021002 90250250112602 1000155001400210002 170011500290027002 10000155001700230002 100115001100017002500120001300015002 100150001100012002 100011500110110002 400015001600112002 80120011015002 1001700115000113002 10012601450012002 1001500011500111002 200150001500120002 10011000150016002 20013250021002 40012001200120001500011001100012000130001资料来源:薛薇,《SPSS统计分析方法及应用》,电子工业出版社,2007年4月。
40第021章频数分布表及其绘制

48
46
42
49
51
50
51
56
42
59
49
48
52
42
49
55
53
51
45
47
47
47
50
48
51
51
53
46
47
57
45
46
51
46
51
47
51
55
47
52
47
48
54
47
54Leabharlann 49445354
45
48
44
48
42
47
48
50
55
50
53
56
49
50
56
41
53
53
49
44
49
48
45
52
52
46
48
51
51
53
46
47
57
45
46
51
46
51
47
51
55
47
52
47
48
54
47
54
49
44
53
54
45
48
44
48
42
47
48
50
55
50
53
56
49
50
56
41
53
53
49
44
49
48
45
52
52
46
54
50
44
53
实验一 频数表的制作(示例)-

实验一:频数分布表的编制统计学的最基本工作是收集数据。
把原始数据收集上来之后,首先要对数据进行整理并分析这些数据的特性和变化规律。
生物统计学中经常遇到的数据有两种类型,一种是连续型数据(continuous data),又称为计量数据(measurement data);另一种是离散型数据(discrete data),又称为计数数据(count data)。
描述数据变化规律的最简单方法是将这些数据列成频数表(frequency table)。
1、离散型数据频数分布表的制作例1:检查200丛稻遗株,每丛内越冬三化螟幼虫的原始调查资料如下(见SAS程序),试编制频数分布表。
data freq_01; input x @@; cards;1 1 0 02 0 0 1 0 2 1 0 1 1 0 1 0 03 0 2 1 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 5 0 1 0 0 0 04 2 0 0 3 0 4 1 3 1 4 0 1 2 6 0 3 2 1 0 2 0 0 1 1 0 0 0 0 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 02 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0;proc freq; run;运行结果:2 连续型数据频数分布表的制作例2:在广州天河区称量106头越冬三化螟幼虫的体重(单位:毫克),根据原始资料(见SAS程序),以6毫克为组距,分成13组,第一组下限为10毫克,制作频数分布表。
Excel频数分布表制作的方法总结

Excel频数分布表制作的方法总结Excel可以使用函数或者数据透视表制作一组数据的频数分布表。
划分的组比较少时,可以使用函数"COUNTIFS(数据,条件1,条件2,...)",相关的介绍有很多,本文对此不作赘述。
组数较多时,则建议使用函数"FREQUENCY(数据,分组)"或者数据透视表,但不同的方法中对于每组的划分有细微的差别,会导致结果不一样,下面将一一总结。
工具/原料MS Excel方法一:FREQUENCY函数1. 1以制作一次考试成绩的频数分布表为例,分数范围为0-100分,以5分为组距:2. 2先在空白处写下每组的分割点,本例为5,10,15,...,95,100,如图中F列;然后选中准备写入相应频数的区域“H2:H21”,在输公式处输入“=FREQUENCY(C2:C564,F2:F21)”,再按Ctrl+Shift+Enter,选中的区域“H2:H21”中就会出现相应的频数。
3. 3从上图中已可见,用FREQUENCY函数算出的每组频数是不包括左端而包括右端的。
例如组“(15,20]”中,成绩为15分的人数不会被算入该组,而成绩为20分的人数会被算入该组。
END方法二:数据透视表1. 1仍用上例,选择要统计的数据区域,点击菜单栏中的“插入->数据透视表”。
2. 2在数据透视表页面,将需要统计的数据(本例为“分数”)拖入“行标签”和“数值”中;点击“数值”中“求和项:分数”,选择“值字段设置”,在弹出的对话框中的“值汇总方式”选择“计数”;3. 3在得到的数据透视表中点击“行标签”列中的任意一格,便可以看到菜单中有一个“将字段分组”的选项,点击该选项后,就可以在弹出的对话框中设置要分组的起点、终点和步长,本例中应该分别设置为0,100,5。
4. 4点击确定后,便可得到所要的频数分布表,如下图中左边的表。
注意,用数据透视表统计的频数分布中,可能会缺少频数为0的组(如本例中得到的结果中缺少“5-10”这一组,),因此最后需要检查一遍各分组,添上缺少的组,相应的频数为0。
定量资料数据的统计描述

f lg X lg f
1
X1,X2…Xn 为各组段的滴度或滴度倒数。 f1,f2…fn分别为各组段的频数。
例2-6 52例慢性迁延性肝炎患者的HBsAg滴度 数据见表2-4,求其平均滴度。
2 1.20412 7 1.50515 ... 7 2.7027 G lg 1 52 lg 1 108.06977/ 52 lg 2.7017 119.74705
①两端的组段应分别包含最小值或 步骤: 最大值; (1) 求全距:(极差) R=29.64-7.42=22.22 ②尽量取较整齐的数值作为组段的 端点,便于对数据进行表述; (2) 定组段数与组距 : 8~15个组段,组距i=全距/组段数 ③组距以相等为宜。 (3) 划组段:以一个稍小于或等于最小值的整数作为第一个
理的各种因素在个体之间都不会完全相同,即个体间存在差
异,因此导致某地18-35岁健康男性居民血清铁含量不会完全 相同,而是呈现或大或小的离散趋势。
一、描述集中趋势的统计指标
平均数:描述一组同质计量资料的集中趋势;反映一组观察值 的平均水平。 常用的平均数有算术均数,几何均数和中位数。 (一)算术均数(mean):简称均数,总体均数用希腊字母µ 表
四、频数分布的类型
对称分布型:指集中位置在正中,左右 两侧频数分布大体对称。
偏态分布型:指集中位置偏向一侧,频数 分布不对称。 正偏态分布:集中位置偏向数值小的一侧。
偏态分布型
频数分布
负偏态分布:集中位置偏向数值大的一侧。
频数表的用途
1. 揭示频数分布的分布特征和分布类型。文献中常 将频数表作为陈述资料的形式。
图中横轴为血清铁含量,纵轴为频率密度,直条面 积等于相应组段的频率。
2.1 频率分布表与频率分布图

频数 (2)
1 3 6 8 12 20 27 18 12 8 4 1 120
频率(%) (3) 0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
100.00
累计频数 (4) 1 4 10 18 30 50 77 95 107 115 119 120 —
100.0
累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0
4
频率分布 图
30 频 率 25 (%)
20
15
10
5
0
0
1
2
3
4
5 >5
产前检查次数
图21 某地96名妇女产前检查次率分布
横坐标:产前检查次数; 纵坐标:频率, 检查k次的妇女 所占的比例(%) 等宽矩形长条:高度为检查次 数的频率
试编制血清含量的频率分布表。
6
编 制 步 骤 : 2
计 算 全 距 (range,R),又 称 极 差
(1)找• 出R = 最最大 值小-值最=小7值.4=229.647.42 = 22.22
3
确 定 组 段 数最与大组值距 = 29.64
•组 段 数 一 般 在 10 左 右 下 限 : 组 段 的 左 端 点
第二章 定量资料的统计描述
一、频率分布表与频率分布图
定
义
当变量值个数较多时,对各变量值出现的频率列表即为频 率分布表(frequency distribution table),简称频率表。
频率分布表的图形表示即为频率分布图。
2
1、离散型定量变量的频率分布
5-2 编制频率频数分布表客户调查与数据分析
三、组距式分布数列
任务1 【步骤5】绘制频率频数分布表。
三、组距式分布数列
任务2:将上述表格制成Word表格。 【步骤1】新建word文件,点击“插入”菜单,选择“表格”
菜单中的“插入表格”,输入“行数”为“8”,输入“列数” 为“3”,并输入相关内容。 【步骤2】点击表格左上角的十字箭头,选择整个表格,点击 “表格工具”中的“设计”,选择“擦除”按钮。 【步骤3】将两边的竖线以及组与组之间的横线用橡皮擦除。
以是非数量标志。
二、分布数列及其分类
2.分布数列分类 (1)变量分布数列 按照数量标志进行分组所得到的分布数列,称为变量
分布数列。 如按照房型需求、成交总价等变量分组就是变量分布
数列。
二、分布数列及其分类
2.分布数列分类 (1)变量分布数列
房型需求频率频数分布表
二、分布数列及其分类
2.分布数列分类 (2)品质分布数列 按照非数量标志进行分组所得到的分布数列,称为品
三、组距式分布数列
组距式分布数列简称组距数列,是指在变量数列中的 每一个组,并不是由一个变量值来表示,而是一定数 值范围形成的数列。
三、组距式分布数列
江苏省第6次全国人口普查人口分布频率频数分布表
上表中的分组变量是人口年龄,而每组的年龄不是一个数值, 而是年龄段,因此这样的分布数列就称为组距式分布数列。
不超过10%。1.5/73.5=2%,小于10%,组距75可以采用。
三、组距式分布数列
任务1 如果分5组,组距=294/5=58.8。为了让组限整齐,组距取整
为60,组限是10的倍数。 误差为1.2。1.2/58.8=2%,小于10%,组距60可以采用。
用Excel_作频数分布表和统计图表
“健力芬达682.00%雪碧9100.00% 二、用Excel作数值数据的频数分布表和直方图例2 某班50名学生的统计学原理考试成绩数据如下:798878507090547258728091959181726173978374616263747499846475657566758567697586597688697787步骤一:输入数据并排序(一)打开Excel工作簿,把本例中的数据输入到A1至A50单元格中。
(二)对上述数据排序。
结果放到B1至B50。
具体步骤如下:1.拖曳鼠标选中A1:A50单元格区域。
在该处,单击鼠标右键,选中“复制”命令。
2.拖曳鼠标选中B1:B50单元格区域。
在该处,单击鼠标右键,选中“粘贴”命令。
3.再次选中B1:B50,选择“数据”下拉菜单中的“排序”选项。
出现对话框,选中按递增 排序即可。
4.单击确定。
步骤二:指定上限在C3至C7单元格中输入分组数据的上限59,69,79,89,100。
I 提示:Excel在作频数分布表时,每一组的频数包括一个组的上限值。
这与统计学上的“上限不在组”做法不一致。
因此50-60这一组的上限为59。
以此类推。
步骤三:生成频数分布表和直方图(一)选择“工具”下拉菜单中的“数据分析”选项。
出现该对话框。
(二)在“数据分析”对话框种选择“直方图”。
(三)当出现直方图对话框时,1.在“输入区域”方框中输入数据所在单元格区域B1:B50。
2.在“接受区域”方框中输入分组数据上限所在单元格区域C3:C7。
3.在“输出区域”方框中输入D3,表示输出区域的起点。
4.在输出选项中,选择“输出区域”、“累计百分比”和“图表输出”。
(四)点击确定。
(五)为了便于阅读,单击频数分布表中的有“接受”字样的单元格,输入“考试成绩”;同样,用50-60代替频数分布表中的第一个上限值59,60-70代替第二个上限值69,以此类推,最后,用90-100代替频数分布表中最后一个上限值100。
频数分布表和频数分布直方图
4.25~4.55 6
0.12
4.55~4.85 23
0.46
4.85~5.15 18
0.36
5.15~5.45 1
0.02
合计
50
1.00
(1)、请你把上表补充完整;
(2)、请你根据频数分布表,画出频数分布直方图
如果视力在4.85以下就属于不正常范围,
人数
那么请你分析一下我们学校的视力情况,
28
(3)确定分点; 确定分点的方法有多 种。通常为了使得每 个数据都落在相应的 组内,可取比数据多 一位小数来分组;
(4)列频数分布表: 把数据划记到相应的 组中,统计每组中相 应数据出现的频数.
(5)画频数分布直方图.注意:各个“条形”之间就 应该是连续的,不应该有间隔,当各组的组距相等 时,所画的各个条形的宽度也应该是相同的;
这就是频数分布表
53 65 74 77
成绩段 49.5~ 59.5~ 69.5~ 79.5~ 89.5~
59.5 69.5 79.5 89.5 99.5
频数记录
正 正正 正正 正
频数
2
9
10 14
5
人数
16
15 14 13 12 11 10
9 8
7 6 5 4 3 2 1
这就是频数 分布直方图
49.5 59.5 69.5 79.5 89.5 99.5 分数
在怎这样组描数述据、中分1析6这3c5m0的名频学数生是身多高少的?分布情况呢?
频率呢?
7.4 频数分布表和频数分布直方图
某中学为了了解八年级学生身高的范围和整体分布 情况,抽样调查了八年级50名同学的身高,结果如下 (单位:㎝) 150 148 159 156 157 163 156 164 156 159 169 163 170 162 163 164 155 162 153 155 160 165 160 161 166 159 161 157 155 167 162 165 159 147 163 172 156 165 157 164 152 156 153 164 165 162 167 151 161 162
(完整)频数分布表和频数分布图
频数分布表与频数分布图频数是指某一随机事件在n次试验中出现的次数。
各种随机事件在n次试验中出现的次数分布就称为频数分布。
对一批数据,将其频数分布用表格的形式表示出来就构成了频数分布表。
(1)编制频数分布表的步骤编制频数分布表是数据整理的基本方法,下面我们结合一个实例来说明频数分布表的编制步骤。
例1.一次物理测验之后,某班48位同学的成绩如下.86 77 63 78 92 72 66 87 75 83 74 47 83 81 76 82 97 69 82 88 7167 65 75 70 82 77 86 60 93 71 80 76 78 57 95 78 64 79 82 68 7473 84 76 79 86 68;根据这一成绩编制频数分布表,其具体步骤是:①求全距(用R表示)。
全距是原始数据中的最大值与最小值之差,即R=max{xi}-min{xi}。
式中R是全距,max{xi}为这批数据中的最大数,min{xi}为这批数据中的最小数.在本例中,max{xi}=97,min{xi}=47,因此R=97—47=50.②定组数(用K表示)。
根据全距决定组数(K)。
组数就是对这批数据分组的个数。
一般而言,组数以10组为宜,多至20组,少至5组。
若组数太多,便会失去实行分组化繁为简的作用;若组数太少,又会引起计算结果的失真。
组数与数据的个数有关,若数据多时,要分10组以上;数据少时,可分5—10组。
③定组距(用i表示)。
组距就是每一个组内包含的间距,即组距(i)是指每个小组的组上限(即组的终点值)与组下限(即组的起点值)之间的距离.显然,在一批数据中,组距一般是相同的.组数与组距有关,组距越小,则组数越多;组距越大,则组数越少.根据上面的讨论,我们得到全距R、组距i、组数K三者之间的关系即i=或K=根据上式,由全距R、组距i决定组数时,将全距R除以组距后取整数即得组数i。
在本例中,全距R=50,若取组距i=5,则组数K=10.④列组限。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
是该 组的上限;最小的可能值就是该组下限。
1、选择分组标志的原则 (1)要根据调查目的和任务选择分组标志
调查对象具有若干特征,都可作为分组 的依据,如何从这些特征中选择作为分组依 据的标志,就应该根据调查的目的和任务来 选择。
(2)要选择能够反映研究对象本质的标志 在研究对象所具有的特征中,有的是 事物的本质特征,有的是一般特征,我们 应从中选择本质特征作为分组标志。同时 要注意将事物的本质特征作为分组标志时, 应注意社会发展变迁的影响。
• 2.统计图的制作 统计图是表现数字资料的一种重要形式, 它具有形象、生动、直观、概括、活泼、 醒目等特点,可使读者一目了然,具有较 强的吸引力和说服力。 按照表现形式的不同,统计图可分为条形 图,直方图,饼图,环形图茎叶图和箱线 图和折线图四种类型。
1. 分组数据:直方图
概念:用矩形的宽度和高度(面积)来表示频 数分布的图形,叫直方图。 直方图一般可用横轴表示数据分组纵轴 表示频数或频率,这样各组和相应的频率就 形成一个矩形,即直方图。 对于等距分组可以用矩形的高度直接表示频数 分布; 对于不等距分组一般用矩形的面积来表示频数 分布,这时需要计算频数密度或频率密度。
(3)应多角度选择分组标志
事物或现象的分组标志不是唯一的,从 多角度选择分组标志,会使我们对社会现象 的认识更加深入。
分组方法
分组方法
单变量值分组 (适用于离散 变量)
组距分组
等距分组
异距分组
组距分组
•将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 要遵循“不重不漏”的原则 采用等距分组,也可采用不等距分组
3. 用Excel制作频数分布表
等距分组表
(上下组限重叠)
三、汇总 • 所谓汇总,就是根据研究目的把分组后的 数据汇集至有关表格中,并进行计算和加 总,以集中、系统的形式反映调查对象总 体的数量情况。 汇总的方法,可分为手工汇总和电子计算 机汇总两大类。
四、制作统计表和统计图 • 汇总的数字资料,一般都要通过表格或图 形表现出来,为此,就要制作统计表和统 计图。 1.统计表的制作 (1)统计表的结构 (2)统计表的分类 (3)制作统计表应该注意的问题
直方图可观察一组数据的分布状况,但没有给出具体的数值; 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保 留了原始数据的信息。
未分组数据—茎叶图(例题分析)
分析市场调查资料
• 一、调查资料分析的意义
• 1、资料分析的含义 • 指将收集到的各类信息资料,按照一定的 程序和方法,进行分类计算、分析和选择等,使 之成为适用的信息资料的过程。 • 指通过对市场调查所获得的资料分解成较 为简单的组成部分,辩析出这些部分的本质属性 和彼此之间的关系,从而对研究的事物、现象有 更清晰、更本质的认识和把握的过程。
市场调查资料整理
二、调查资料分析的基本原则
及时性
1.
2.
3. 4.
5.
6.
用于显示未分组的原始数据的分布。 由“茎”和“叶”两部分构成,其图形是由数字组成的。 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留一位数字。 对于 n(20 n 300) 个数据,茎叶图最大行数不超过 L = [ 10 × lg n ]。茎叶的行数可以拉长。 茎叶图类似于横置的直方图,但又有区别:
第三、 数字资料的整理
数字资料的整理,一般要经过检验、分组、 汇总、制作统计表或统计图等四个步骤。 一、检验 检验,就是检查、验证各种数字资料是否完 整和正确。 数字资料的正确性检验,一般采用三种方法: 1.经验判断 2.逻辑检验 3.计算审核
二、分组 就是根据社会调查研究的目的和要 求,按照一定的标志,将所研究的事物 或现象区分为不同的类型或组的一种整 理资料的方法。
浅谈市场调查资料的整理与分析
社会调查资料的整理
第一、资料整理的步骤和内容
1、步骤
1)资料审核
2)资料的编码和登录
3)资料的分组
4)资料的汇总
5)制作统计图和统计表
2、审查内容
1)资料的真实性
2)资料的准确性
3)资料的完整性
• 第二、整理资料的意义 整理资料,就是根据调查研究的目的,运 用科学的方法,对调查所获得的资料进行审 核、检验、分类、汇编等初步加工,使之系 统化和条理化,并以集中、简明的方式反映 调查对象总体情况的工作过程。 • 整理资料的重要意义在于: 1.它是提高调查资料质量及其使用价值的必 要步骤。 2.它是研究资料的重要基础。 3.它是保存资料的客观要求。
3. 统计出各组的频数并整理成频数分布表
频数分布表的编制 (例题分析)
【例】某电 脑 公 司 2007 年前四个月 各天的销售 量数据(单 位:台)。 试对数据进 行分组。
原始 数据
频数分布表的编制 举例(步骤)
1. 确定组数 2. 确定各组的组距: 组距=( 237 - 141)÷ 10=9.6 10
①根据统计研究的需要,将原始数据按照不 同的数量级别划分为不同的组别的过程。 ②分组以后的数值型数据称为分组数据。 ③数值型数据分组可分为单变量分组和组距 分组。
1)把整个数据中,每一数据值(变量值)作为
一 组,这样的分组称为单变量分组。
2)将全部变量值一次划分若干数量区域,并将
在此区域的变量值作为一组称为组距分组。
~ ~ ~ ~ ~
组距分组 (步骤)
1. 确定组数:组数的确定应以能够显示数据的分 布特征和规律为目的。建议组数=1+lg N/lg2
2. 确定组距:组距 (Class Width) 是一个组的上限与下 限之差,可根据全部数据的最大值和最小值及所分 的组数来确定,即 组距=( 最大值 - 最小值据绘制)
我一眼就看出 来了,销售量 在 170 ~ 180 之间的天数最 多!
频 数
30 25
直方图下的面 积之和等于1
(天) 20 15
10
5
140 150 160 170 180 190 200 210 220 230 240
某电脑公司销售量分布的直方图
2.未分组数据:茎叶图