统计整理的意义和程序
统计整理——精选推荐

第三章统计整理本章内容提要第一节 统计整理的概念和程序一、统计整理的概念统计整理就是根据统计研究的目的和任务,将调查取得的大量原始资料进行科学的分类(或分组)、汇总,为统计分析提供条理化、系统化的综合统计资料的工作过程。
二、统计整理的程序统计整理按以下程序进行:(1)对调查资料的审核。
主要包括:准确性审核、完整性审核、及时性审核、适用性审核。
(2)统计分组。
(3)统计汇总。
(4)编制统计表。
第二节 统计分组一、统计分组的意义和作用统计分组就是根据统计研究的目的和任务,按照选定的变异标志将总体划分为若干部分或组别,使组与组之间具有差异性,而同一组内的单位保持相对的同质性。
统计分组在统计研究中的作用主要体现在以下三方面:(1)区分社会经济现象的类型。
(2)研究总体内部结构。
(3)研究现象之间的依存关系。
二、分组标志的选择正确选择分组标志是统计分组的核心问题。
分组标志就是将总体划分为若干部分或组别的标准或根据。
正确选择分组标志必须遵循以下三个基本原则:(1)根据统计研究的具体任务和目的,选择与研究现象联系最密切的标志作为分组标志。
(2)在对被研究现象进行理论分析的基础上,从中选择具有本质性的重要标志作为分组标志。
(3)结合现象所处的具体历史条件或社会经济发展条件选择分组标志。
三、统计分组的种类(一)按分组标志的性质可分为品质标志分组和数量标志分组品质标志分组就是根据统计研究的目的,选择反映事物性质属性差异的品质标志作为分组标志,在品质标志变异的范围内划定各组的界限,将总体区分为若干个性质不同的部分或组别。
数量标志分组就是根据统计研究的目的,选择反映事物数量差异的数量标志作为分组标志,在数量标志变异范围内划定各组的数量界限,将总体划分为性质不同的若干部分或组别。
(二)按分组标志的多少可分为简单分组和复合分组简单分组就是对总体只按一个标志进行分组。
复合分组就是对同一总体采用两个或两个以上标志结合起来进行分组。
统计整理的意义、原则与步骤

2. 计算检查
检查调查表中的各项数据在计算结果和计算方法 上有无错误
主要用于对定距和定比数据的审核
•
数据的审核
(第二手数据)
1. 适用性审核
弄清楚数据的来源、数据的口径以及有关的 背景材料
确定这些数据是否符合自己分析研究的需要
2. 时效性审核
应尽可能使用最新的统计数据
统计整理的意义、原则 与步骤
2020年4月29日星期三
第三章 统计整理
❖ 统计资料整理的主要步骤是对调查得来的数 据进行审核、分组、汇总并编制统计表
•
•主要任务 •资料审核、分组、 •。汇总、制表、制图等
•分
•频数分布 •统计表
•统计
组
图
•
统计整理在整个统计工作中起着承前启后 的重要作用,它既是统计调查的继续, 又是统计分析的前提。
90 ~ 100
2
少,绝大多数学生的考分
合计
50
分布在60—89分之间。
• 所以,统计整理是统计调查的继续,是统计分析 的前提,它实现了从个别单位的标志表现(标志值
)向总体综合指标的过渡,在统计研究中起着承前
启后重要的作用。
•
•.
统计分组
•
一、统计分组的概念
统计分组是根据所研究事物的特点和统 计研究的目的,按照某一标志将统计总体划分 为若干个组成部分的一种统计方法。
•男生 女生
• 二年级
•男生 女生
•
•.
次数分布
❖ 将总体按照某种标志分组,并将总体中的所 有单位按组归类整理,形成总体中各个单位 数在各组间的分布,称为次数分布
❖ 各个组的单位数为次数(频数) ❖ 比率(频率)=各组频数/总频数
统计整理的意义和程序

第三章统计数据的整理和显示一、教学目的和要求①明确统计整理的概念、意义和内容;②掌握统计分组的概念、原则、方法和作用,了解分组的类型;③熟悉频数分布的概念、种类;④熟悉变量数列的编制方法,注意组距数列中的一些基础知识;⑤熟悉统计表的构成和制表、填表规则。
二、教学时数:6学时三、教学重点统计数据分组的类型原则和方法、变量数列特别是组据数列的编制方法、统计表设计的原则和方法。
四、教学难点变量数列的编制。
五、教学方法基本知识通过案例结合EXCEL软件演示授课。
六、教学内容第一单元统计数据整理概述和统计分组教学目的要求:理解数据整理的概念、种类理解数据整理的主要原则和内容掌握数据预处理的方法理解理解数据分组的涵义和类型教学重点:数据整理的原则内容统计数据分组的类型教学难点:数据的预处理、对数据分组概念的辩证理解授课时数:2学时第一节统计数据整理概述一、统计整理及其类型(一)统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。
对已整理过的资料(包括历史资料)进行再加工也属于统计整理。
(二)统计整理的意义1、通过统计调查可以取得第一手资料,但这种资料只能反映总体各单位的具体情况,是分散、零碎、表面的。
要说明总体情况,揭示出总体的内在特征,还需要对这些资料进行加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。
2、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。
统计整理是统计调查的继续,又是统计分析的基础。
统计调查所搜集到的资料,只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识社会的过程中,实现由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。
否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。
3、统计整理还是积累历史资料的必要手段。
统计学原理与技能训练 第3章 统计整理

四、统计分组的方法 1.根据分组标志的性质不同分为两种 (1)按品质标志分组 例如按性别这一品质标志可将班级的学生 分为两组。 (2)按数量标志分组 如按成绩这一数量标志可以将班级学生分 为三组:60分以下为一组,60~80分为一组, 80分以上为一组。
2.根据分组标志的多少分为两种 (1)简单分组 按一个分组标志分组。 (2)复合分组 按两个或两个以上标志重叠分组。如按性 别可以将人口分为两组,在此基础上又可以按 年龄将各组的人分为少年组、青年组、中年组 和老年组。
二、统计整理的步骤
(一)设计和编制统计资料整理方案 (二)对原始资料进行审查 1.逻辑审查:主要是从定性的角度审查数 据是否符合逻辑,内容是否合理,各项目或数 量之间有无相互矛盾的现象。 2.计算审查:是指审查调查表中的各项数 据在计算结果和计算方法上有无错误。如各分 项数字之和是否等于相应的合计数,各结构之 和是否等于1或100%等。
第一节 统计整理的意义和步骤
一、统计整理意义 (一)概念 统计整理是根据统计研究的目的和要 求,对统计调查所搜集到的原始资料进行 分组、汇总,使其条理化、系统化、科学 化,从而得到表现总体特征的综合统计资 料的统计过程。 另外,对于整理过的初级资料进行再 整理,也属于统计整理。
(二)意义 1.统计整理是统计调查的继续,也是统 计分析的前提,它在统计研究中起着承前 启后的作用。 2.资料整理得是否正确,直接决定着整 个统计研究任务的完成。不恰当的加工整 理,不完善的整理方法,往往使调查得来 的丰富、完备的资料失去价值,得不到正 确的结论。
表3 -3
某车间50名工人日加工零件数分组表
向 上 累 计 向 频 下 数 累 计 频 数 频 率 频率
按零件数分组 频数 频率 (人) (%) (个/人)
第4章 统计资料整理

20
例:某企业工人日产量资料如下
日产量分组(件) 工人数 日产量分组(件) 工人数
50—60 60—70 70—80 80—90
6
90—100
15
9
100—110
18
12
110—120
20
14
120—130
8
要求:1、指出上述变量数列属于哪一种变量数列? 这个数列说明什么问题?
2、指出统计表中的变量、变量值、上限、下限、次 数、频率、总体单位总数
200以下 10 200—400 30 400—600 35 600—800 15 800以上 10
频率 10%
30% 35% 15% 10%
要求:各组的频率大于0,各组的频率总和等于1 •累计频数指首先列出各组的组限,然后依次累计到本 组为止的各组频数。 •累计频率指累计频数除以频数总和。
2019/9/26
2019/9/26
27
平衡数列
平衡数列是利用总体内部有关变量或统计指标之间 的数量平衡关系而编制的统计数列,又称平衡表。
结构关系、比例关系 平衡关系有:相加平衡关系、相减平衡关系、收支
平衡关系。 分类
按内容不同分为人口平衡表、劳动力平衡表等。 按计量单位不同有价值量平衡表、实物量平衡表。 按统计范围不同分为综合平衡表、专项平衡表。 按排列不同分为收支对照式和棋盘式。
• 汇总技术:
手工汇总:划记法、过录法、折叠法、卡片法。
电子计算机汇总
5、表现统计资料
编表:经过汇总,得出表明社会现象总体和各个组的单 位数和一系列标志总量的资料,把这些资料按一定的规则在 表格上表现出来。
统计表、统计图、统计报告、统计模型、统计数据库
统计学原理课件:第三章 统计数据的整理与显示

2、不重合式
指前一组的上限与后一组的下限,两值紧密相连而不相重 复。
一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6,
7和7以上
组 中值
组中值:各组上下限的中点值,代表组内各标志值的一般水平。 重合式组限时:
3、会审汇编:将下级统计工作人员集中到上级机关, 共同审核和汇总统计资料(如:年报),可以节省时 间,随时纠正资料中的错误,交流经验,提高水平。
4、综合汇总:对各级需要的基本资料实行逐级汇总, 对调查所得的其他资料实行集中汇总(人口普查)
三、统计汇总的技术
1、手工汇总 2、电子计算机汇总
第五节 分布数列
U形分布数列
J形分布数列 J形
倒J形
按分组形式 单项式数列
组距式数列 等距数列
异距数列
按分组标志不同分为品质数列和变量数列(按 数量标志分组)
1.品质分布数列例:
按性别分组 男性 女性
合计
人数 600 400
1000
所占% 60 40
100
各组名称 次数(频数)
频率
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
n 1 3.3lg N n : 组数,N:总体单位数,d:组距,R:全距 X max:最大变量值,X min:最小变量值
N 15-24 25-44 45-89 90-179 180-359 360-719
n5
6
7
8
9
10
适用条件:
统计学第三章 统计数据的整理

汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
统计数据的整理

3.圆滑曲线图
曲线图
统计原理>>第二章>>第二节
四、统计分组过程与变量分布的形成———变量分 布数列的编制
*(四)累计频数和频率分布表
1.较小制累计,也称向上累计 它是将各组频数和频率,由变量值低的组向变量值高的 组逐组累计。单项数列中的向上累计表示等于及小于该组 变量值的频数和频率共有多少;组距数列中表示各组上限 以下总共所包含的总体频数和频率有多少。
四、统计分组过程与变量分布的形成———变量分 布数列的编制
(二)变量分布数列编制
1.单项式变量分布数列的编制 (2)单项式变量分布数列的方法 ①按变量值大小顺序排列; ②每种变量值为一组(重复者只取一个); ③绘制单项式变量分布数列表并汇总出各组频数。
统计原理>>第二章>>第二节
四、统计分组过程与变量分布的形成———变量分 布数列的编制
统计原理>>第二章>>第二节
四、统计分组过程与变量分布的形成———变量分 布数列的编制
(二)变量分布数列编制
2.组距式变量分布数列的编制 (4)异距式数列的编制方法
组距不相等的数列,叫做异距数列或不等距数列。 异距数列分组情况比较复杂。任何事物都有质和量两 个方面。没有质,也就没有量;没有量,也就没有质。二者相 互依存,相互制约,是辩证的统一。统计所研究的量,都有质 的规定性,离开事物质的规定性,统计就不能研究它的量。同 时,量变会引起质变。任何事物的发展变化总有一个数量界 限,达到或超过一定的数量界限就会发生质的变化。因此,在 编制异距变量分布数列时,要同时考虑质与量两个方面,即品 质标志或数量标志。
统计数据的整理
一、统计数据整理的意义和步骤 二、统计数据的审核 三、统计分组 四、统计分组过程与变量分布的形成——变量 分布数列的编制 五、统计汇总 六、统计整理结果的显示
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计整理的意义和程序第三章统计数据的整理和显示一、教学目的和要求①明确统计整理的概念、意义和内容;②掌握统计分组的概念、原则、方法和作用,了解分组的类型;③熟悉频数分布的概念、种类;④熟悉变量数列的编制方法,注意组距数列中的一些基础知识;⑤熟悉统计表的构成和制表、填表规则。
二、教学时数:6学时三、教学重点统计数据分组的类型原则和方法、变量数列特别是组据数列的编制方法、统计表设计的原则和方法。
四、教学难点变量数列的编制。
五、教学方法基本知识通过案例结合E某CEL软件演示授课。
六、教学内容第一单元统计数据整理概述和统计分组教学目的要求:理解数据整理的概念、种类理解数据整理的主要原则和内容掌握数据预处理的方法理解理解数据分组的涵义和类型教学重点:数据整理的原则内容统计数据分组的类型教学难点:数据的预处理、对数据分组概念的辩证理解授课时数:2学时第一节统计数据整理概述一、统计整理及其类型(二)数据整理的内容(2)根据研究目和统计分析的需要,选择整理的标志,并进行划类分组。
统计分组是统计整理的重要内容和统计分析的基础,只有正确的分组才能整理出有科学价值的综合指标,并借助这些指标来揭示现象的本质与规律。
(5)对统计数据分门别类地系统积累。
三、数据的预处理其次,是检查各项目之间有无相互矛盾的地方。
例如,企业的净产值大于同期总产值就是明显的逻辑错误。
(2)计算检查即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。
通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。
(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。
(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。
(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。
四、统计分组的含义1.概念:根据社会经济现象的特点和统计研究的目的要求,按照一定的标志把总体划分为若干不同性质的组或类型,称为统计分组。
统计分组的对象是总体,统计分组的标志可以是品质标志,也可以是数量标志。
2.统计分组的深层次理解从分组的性质来看,分组兼有“分和合”双重含义。
(1)对于现象总体而言,是“分”,即把总体分为性质相异的若干部分;而对于总体单位而言,又是“合”,即把性质相同的许多总体单位合为一组。
(2)对于分组标志而言,是“分”,即按分组标志将不同的标志表现分为若干组,而对于其他标志而言,是“合”,即在一个组内的各单位即使其它标志表现不相同也只能结合在一组。
由此可见,选择一种分组方法,突出了一种差异,显示了一种矛盾,必然同时掩盖了其他差异,忽略了其他矛盾。
不同的分组方法,可能得出不同的结论。
缺乏科学根据的分组,不但无法显示事物的根本特征,甚至会把不同性质的事物混淆在一起,歪曲社会经济现象的本质。
因此,统计分组必须先对所研究现象本质作全面地、深刻地分析,确定所研究现象类型的属性及其内部差别,而后才能选择反映事物本质的正确的分组标志。
五、统计分组的类型(一)按分组的作用或目的不同,分为类型分组、结构分组和分析分组。
1.类型分组:是将复杂的现象总体,划分为若干个不同性质的部分。
3.分析分组:是为研究现象之间依存关系而进行的统计分组。
分析分组的分组标志称为原因标志,与原因标志相对应的标志称为结果标志。
如影响某种商品消费需求的因素有:该商品的价格、消费者收入、相关商品的价格、消费者偏好以及消费者对该商品的预期等。
原(二)按分组标志的多少,可分为简单分组、复合分组和并列分组。
1.简单分组:就是对总体只按一个标志进行分组。
例如国民生产总值按产业分为第一、第二、第三产业三组;货运量按运输方式分为铁路运输、公路运输、水陆运输、航空运输与管道运输等五组。
2.复合分组:就是对总体按两个或两个以上的标志进行的重叠式分组,即在按某一标志分组的基础上再按另一标志进一步分组。
3、分组体系:就是同时用两个或两个以上的标志,分别从不同的角度,进行不重叠的多种分组。
也就是说,很多简单分组从不同角度说明同一个总体,就构成一个并列的分组体系。
例如,职工先按性别分成两组,另按年龄分成若干组;进口总额先按贸易对象分成若干组,另按商品用途分成若干组。
分组体系的特点是两种或多种分组相互独立而不重叠,既可从不同的方面反映事物的多种结构,又不致使分组过于烦琐,故被广泛采用。
(三)按分组标志的性质,分为属性分组和变量分组。
1.属性分组:是按品质标志进行的分组,即按事物的某种属性分组。
如企业按经济类型、行业分组;人口按性别、民族分组;大学生按专业分组等。
这种分组可以反映总体的构成和不同属性事物在总体中的地位和作用。
2.变量分组:是按数量标志进行的分组。
如企业按生产能力、劳动生产率分组;商店按商品流转额、职工人数分组;人口按年龄、身高分组等。
这种分组的目的在于通过事物在数量上的差异来反映事物在性质上的区别。
属性分组和变量分组是一对重要的统计分组,统计分组方法主要是围绕这两种分组来阐述的。
单元小结:1.统计数据整理主要是将搜集的原始数据加工成反映总体特征的综合数据的工作过程,在统计过程中起着承上启下的作用。
统计数据整理包括定期统计报表数据的整理、专题统计数据的整理和历史统计数据的整理。
统计数据整理的原则是3.统计数据分组是分与合的辨证统一,其类型中最重要的是按分组标志的性质和分组标志的多少分。
习题布置:见《统计学原理习题集》第三章第17至23页,朱胜主编,中国统计出版社第二单元统计数据分组与频数分布教学目的要求:掌握统计数据分组的原则、方法和作用了解统计数据分组的类型熟悉频数分布的概念、种类熟悉变量数列的编制方法,注意组距数列中的一些基础知识教学重点:数据分组的原则、方法变量数列的编制教学难点:频数累计与组据数列的编制授课时数:2学时一、统计数据分组的原则和方法(一)统计数据分组的原则统计分组,必须遵循以下两个原则:1.穷尽原则:就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。
例如,从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,那些文盲或识字不多的以及大学以上的学历者则无组可归。
如果将分组适当调整为文盲及识字不多、小学程度、中学程度、大学及大学以上,这样分组,就可以包括全部从业人员的各种不同层次的文化程度,符合了分组的穷尽原则。
2.互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。
例如,某商场把服装分为男装、女装、童装三类,这不符合互斥原则,因为童装也有男、女装之分。
若先把服装分为成年与儿童两类,然后每类再分为男女两组,这就符合互斥原则了。
(二)分组标志的选择分组标志是统计分组的依据或标准。
正确选择分组标志是进行统计分组的关键,分组标志确定得恰当与否会直接影响统计分组的作用。
为了正确选择分组标志,必须遵循以下几条原则:1.要符合统计研究的目的和要求统计分组是为统计研究服务的,统计研究的目的不同,选择的分组标志也应有所不同。
例如,同是以工业部门为研究对象,当研究的目的是为了分析部门中各种规模的企业的生产情况时,应该选择产品数量或生产能力作为分组标志;当研究目的在于确定工业内部比例及平衡关系时,应该以行业为分组标志,将工业部门划分为重工业与轻工业或冶金、电力、化工、机械、纺织、煤炭等工业行业。
2.必须选择最重要的标志作为分组依据社会经济现象纷繁复杂,研究某一问题可能涉及许多标志,科学的统计分组则应从中选择与统计研究的目的、与有关事物的性质或类型关系最密切的标志,即最主要或最本质的标志作为统计分组的依据。
3.要考虑到社会经济现象所处的具体历史条件[例如,同是划分企业规模,在劳动密集型的行业或地区,可采用职工人数作为分组标志;而在技术密集型的行业或地区,则应选择固定资产价值或生产能力作为分组标志。
](三)分组界限的划分(分组标志确定后,分组界限便成为数据分组的重要问题)1.按属性分组时,确定各组的界限有两种情况:(1)组限是自然形成的或比较明显的;例如,人口按性别、文化程度、党派分组等。
(2)由于存在属性之间的过渡形式,使分组界限难以确定。
这种比较复杂的属性分组,国家有关部门都制定有标准的分类目录,分组时可以依据分类目录来确定组限。
例如,人口按职业分组,企业按行业分组,产品按经济用途分组等。
2.按变量分组时,应注意以下两点:(1)分组时各组数量界限的确定必须能反映事物质的差别。
例如,学生学习成绩分组,不能把55分和65分合为一组,因为这样的分组未区分及格与不及格的质的差别。
(2)其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限和组数。
①单项式分组与组距式分组1)单项式分组:就是用一个变量值(标志值)作为一组,形成单项式变量数列。
单项式分组一般适用于离散型变量且变量变动范围不大的场合。
如,育龄妇女按其生育子女存活数分组,可分为0个、1个、2个、3个、4个、5个等6组。
2)组距式分组:就是将变量依次划分为几段区间,一段区间表现为“从到”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。
区间的距离就是组距。
对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。
例如,反映居民居住水平情况按人均居住面积分组分为:4平方米以下,4-6平方米,6-8平方米,8平方米以上等4组。
再如了解某班学生成绩情况,按成绩进行组距式分组。
②间断组距式分组和连续组距式分组在组距式分组中,每组包含许多变量值,每一组变量值中,其最小值为下限,最大值为上限。
组距是上下限之间的距离,相邻两组的界限,称为组限。
间断组距式分组:是指凡是组限不相连的分组。
例如,儿童按年龄分组分为未满1岁,1-2岁,3-4岁,5-9岁,10-14岁。
连续组距式分组:凡是组限相连(或称相重叠的)分组,即以同一数值作为相邻两组的共同界限的分组。
例如,工人按工时定额完成程度分组分为90-100%,100-110%,110-120%等组。
如果变量值只是在整数之间变动,例如企业数、职工数、机器设备台数等离散型变量,可采用间断组距式分组,也可采用连续组距式分组。
如果变量值在一定范围内的表现即可以是整数,也可以是小数,如产值、身高、体重等连续型变量,只能采用连续组距式分组。
在进行连续组距式分组时应注意,由于以同一个数值作为相邻两组共同的界限,为了遵循统计分组穷尽和互斥原则,所以统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,即所谓“上限不在内”原则。