了解统计资料整理的意义和步骤
第二章第二节 统计整理

第二节统计整理一、统计整理的概念和意义统计整理是指根据统计研究的目的和任务,对统计调查或科学实验获得的大量原始资料进行科学的分类、汇总,或对已经加工过的资料进行再加工,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料的工作过程。
通过统计调查或实验,我们取得了大量的原始资料,但这些原始资料一般是分散的、不系统的个体资料。
它们只能说明总体各单位的具体情况,而不能说明总体特征,难以反映总体的全貌情况。
用这样的资料,无法从总体上认识和研究社会经济现象的数量表现,无法揭示社会经济现象发展变化的本质和规律。
因此,必须对这些分散的、不系统的个体资料采用科学的方法进行加工、整理、汇总,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料,并以此计算各种反映总体特征的综合指标,认识社会经济现象的总体特征和全貌,认识、分析社会经济现象的本质和发展变化规律。
可见,统计整理不是单纯的数据汇总,而是运用科学的方法,对调查资料进行分类和综合,从感性认识上升到理性认识。
它是从对社会经济现象个体量的认识到社会经济现象总体量的认识的连接点,是统计调查的继续,是统计显示与分析的前提和基础,在整个统计工作中起着承前启后的作用。
统计数据整理的质量,直接影响着统计工作的成果。
二、统计整理的内容统计整理的内容,主要包括以下几个方面:(1)对原始资料进行审核与检查,如果发现被调查单位的资料不齐全或有差错,要及时查询订正。
(2)对各项指标进行综合汇总,并按调查和分析目的的要求进行各种分组,汇总出各组单位数和各项指标的总数。
(3)将汇总的结果编制成统计表与统计图,以便进一步分析和应用。
三、统计整理的方法与步骤(一)统计分组统计分组是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干组成部分。
理解统计分组的概念要注意三点:(1)统计分组的对象是总体。
(2)统计分组应有分组标志。
(3)统计分组对总体而言是“分”,对总体单位而言是“合”。
第三章 统计资料整理

2.分组表: 2.分组表:主词按一个标志分组的统计表. 分组表
复合表: 3. 复合表:主词按两个或两个以上标志复合 分组的统计表. 分组的统计表.
四,统计表的编制原则
应遵循科学,实用,简明,美观的原则. 应遵循科学,实用,简明,美观的原则. 统计表的各种标题要简明扼要; 1.统计表的各种标题要简明扼要; 要合理安排统计表的结构; 2.要合理安排统计表的结构; 数据计量单位相同时,可放在表的右上角标明, 3. 数据计量单位相同时 , 可放在表的右上角标明 , 不同 时应放在每个指标后或单列出一列标明; 时应放在每个指标后或单列出一列标明; 表中的上下两条横线一般用粗线,其他线用细线; 4.表中的上下两条横线一般用粗线,其他线用细线; 5.统计表的栏数较多时,通常要加以编号; 统计表的栏数较多时,通常要加以编号; 通常情况下,统计表的左右两边不封口; 6.通常情况下,统计表的左右两边不封口; 表中的数字应该填写整齐,对准位数; 7.表中的数字应该填写整齐,对准位数; 对于没有数字的表格单元,一般用" 表示; 8.对于没有数字的表格单元,一般用"—"表示; 表中主词各行和宾词各栏, 9. 表中主词各行和宾词各栏 , 应按先局部后整体的原则 排列; 排列; 10.必要时可在表的下方加上注释. 10.必要时可在表的下方加上注释.
�
编制
四,次数分布的主要类型 钟型分布——"两头小,中间大" 两头小,中间大" 钟型分布 两头小
对称分布
右偏分布
左偏分布
两头大, U型分布——"两头大,中间小" 型分布 两头大 中间小"
U型分布
一边小, J型分布——"一边小,一边大" 型分布 一边小 一边大"
统计学原理与技能训练 第3章 统计整理

四、统计分组的方法 1.根据分组标志的性质不同分为两种 (1)按品质标志分组 例如按性别这一品质标志可将班级的学生 分为两组。 (2)按数量标志分组 如按成绩这一数量标志可以将班级学生分 为三组:60分以下为一组,60~80分为一组, 80分以上为一组。
2.根据分组标志的多少分为两种 (1)简单分组 按一个分组标志分组。 (2)复合分组 按两个或两个以上标志重叠分组。如按性 别可以将人口分为两组,在此基础上又可以按 年龄将各组的人分为少年组、青年组、中年组 和老年组。
二、统计整理的步骤
(一)设计和编制统计资料整理方案 (二)对原始资料进行审查 1.逻辑审查:主要是从定性的角度审查数 据是否符合逻辑,内容是否合理,各项目或数 量之间有无相互矛盾的现象。 2.计算审查:是指审查调查表中的各项数 据在计算结果和计算方法上有无错误。如各分 项数字之和是否等于相应的合计数,各结构之 和是否等于1或100%等。
第一节 统计整理的意义和步骤
一、统计整理意义 (一)概念 统计整理是根据统计研究的目的和要 求,对统计调查所搜集到的原始资料进行 分组、汇总,使其条理化、系统化、科学 化,从而得到表现总体特征的综合统计资 料的统计过程。 另外,对于整理过的初级资料进行再 整理,也属于统计整理。
(二)意义 1.统计整理是统计调查的继续,也是统 计分析的前提,它在统计研究中起着承前 启后的作用。 2.资料整理得是否正确,直接决定着整 个统计研究任务的完成。不恰当的加工整 理,不完善的整理方法,往往使调查得来 的丰富、完备的资料失去价值,得不到正 确的结论。
表3 -3
某车间50名工人日加工零件数分组表
向 上 累 计 向 频 下 数 累 计 频 数 频 率 频率
按零件数分组 频数 频率 (人) (%) (个/人)
调查资料的整理方法

体操
3枚
射击
3枚
柔道
2枚
田径
1枚
跆拳道
1枚
频率 f /∑f
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
– 数量标志是反映事物数量特征的标志,如分析贫困问题
将贫困户按家庭人口分组,了解职工生活按经济收入分组,研究 地区的社会保险按参保企业个数分组等。
– 按数量标志分组,必须以分组结果能够反映被研究现 象的不同类型和性质差异为前提。
三、分组的类型
(二)按分组标志数量的多少划分 :
– 简单分组:对调查对象只按一个标志进行的分组。
– 复合分组时,先按一个标志分组,然后,再对每一个组别按另一个标志作进一步分 组。复合复合分组在分组时,应根据分析的要求,确定分组标志的主次顺序,主要 标志在先,次要标志在后。
按性别 分组
男 女
按民族 分组
汉族组 藏族组 回族组 维吾尔族 组
……
按年龄 分组
0— 6岁组 7—17岁组
18—59岁 组 60岁以上组
选择分组标志的原则 根据统计研究的目的选择分组标志 根据现象的本质特征选择分组标志 考虑现象所处的具体时空条件。
关键:服从研究任务需要,反映总体本质特征
三、分组的类型
• (一)按分组标志性质的不同划分: – 品质标志是反映事物属性的标志,如老年人按婚姻状况、
户居方式、受教育水平分组;流浪儿童按外流原原因、外流生活 来源、流出地分组;人口职业分组等。
下限在内,上限不在内原则
等距分组
各组组距相等的分组称为等 距分组。
异距分组
各组组距不全相等的分组称 为异距分组。
3统计资料整理

使用时间 0 包退、换 7天
免费(免费)
3年
10年 淘汰
保修(收费)
对产品故障浴缸曲线的说明
产品的故障率受产品自身缺陷和老化两个因素影响: 在使用初期,由于产品自身缺陷造成的故障率较高,在 使用后期,由于老化引起的故障率较高,中间阶段则正 好处于两个故障率均较低的阶段。 浴缸曲线对厂商制定服务政策有重要的借鉴意义。
(三)J形分布 正J形分布
累 计 收 入 比 重 ( % ) 累计家庭户数比重(%) 资产规模(个) 企 业 数
反J形分布
收入分配的洛伦滋曲线
企业数按资产规模分布
任务四 统计表和统计图
一、统计表的意义和结构 (一)统计表的意义 1、含义 用纵横交错的线条绘制出来的、表现统计资 料的表格。 广义的统计表包括在统计调查、统计整理和统 计分析等统计活动各个阶段使用的表格; 狭义的统计表特指在统计整理过程中使用的 统计表,即统计汇总表。
(2)分组形式
简单分组:选择一个标志对总体进行的分组。
某班级学生构成情况
年龄
20岁以下
人数 (人) 10 30
10 50
比重 (%) 20 60
20 100
20-22
22岁以上 合 计
复合分组 选择两个或两个以上的标志并将它们层叠起来对总体进 行的分组。 例:某班级学生构成情况
人数(人) 20岁以下 男 其中: 女 20—25岁 其中:男 女 合 计 20 12 8 30 20 10 50 比重(%) 40.0 60.0 40.0 60.0 66.6 33.3 100
20
13 50
37
50 ——
74
100 ——
(2)向下累计 某班50名学生按成绩分布 成绩 60以下 60—80 80—90 90以上 合 计 人数 (人) 2 15 20 13 50 累计人数 (人) 50 48 33 13 —— 累计比重 (%) 100 96 66 26 ——
第4章 统计资料整理

20
例:某企业工人日产量资料如下
日产量分组(件) 工人数 日产量分组(件) 工人数
50—60 60—70 70—80 80—90
6
90—100
15
9
100—110
18
12
110—120
20
14
120—130
8
要求:1、指出上述变量数列属于哪一种变量数列? 这个数列说明什么问题?
2、指出统计表中的变量、变量值、上限、下限、次 数、频率、总体单位总数
200以下 10 200—400 30 400—600 35 600—800 15 800以上 10
频率 10%
30% 35% 15% 10%
要求:各组的频率大于0,各组的频率总和等于1 •累计频数指首先列出各组的组限,然后依次累计到本 组为止的各组频数。 •累计频率指累计频数除以频数总和。
2019/9/26
2019/9/26
27
平衡数列
平衡数列是利用总体内部有关变量或统计指标之间 的数量平衡关系而编制的统计数列,又称平衡表。
结构关系、比例关系 平衡关系有:相加平衡关系、相减平衡关系、收支
平衡关系。 分类
按内容不同分为人口平衡表、劳动力平衡表等。 按计量单位不同有价值量平衡表、实物量平衡表。 按统计范围不同分为综合平衡表、专项平衡表。 按排列不同分为收支对照式和棋盘式。
• 汇总技术:
手工汇总:划记法、过录法、折叠法、卡片法。
电子计算机汇总
5、表现统计资料
编表:经过汇总,得出表明社会现象总体和各个组的单 位数和一系列标志总量的资料,把这些资料按一定的规则在 表格上表现出来。
统计表、统计图、统计报告、统计模型、统计数据库
《应用统计学》第三章:统计整理

三、次数分布数列的编制
根据变量的类型和变量值的多少确定是编 制单项数列还是编制组距数列
单项变量数列的编制方法
编制步骤
第一,将日产量按从小到大顺序排列 第二,将变量值分为若干组 第三,找出每组变量出现的次数 第四,按变量值的大小顺序编制出单项数列
【例】己知某车间有24名工人,他们的日产量(件) 资料,要求编制变量数列。
返回
第三节 统计数据分组与频数分布
一、统计数据分组的原则
穷尽原则:就是使总体中的每一个单位都 应有组可归,或者说各分组的空间足以容 纳总体所有的单位
互斥原则:就是在特定的分组标志下,总 体中的任何一个单位只能归属于某一组, 而不能同时或可能归属于几个组
二、统计数据分组的步骤和方法
统计分组一般经过三个步骤:即选择分组 标志、分组界限的划分、选用分组体系
组距式变量数列编制方法
第四,计算组限,指每组两端数值,分为上 限和下限 上限:每组的终点数值(最大值) 下限:每组的起点数值(最小值) 第五,计算次数和频数
组距式变量数列编制方法
第六,计算组中值,即各组中点位置所对应的变 量值。其计算公式为:
组中值= 或=
上组下限 本组下限 2
本组组距 2
(适用所有闭口组)
(2)从内容上来看,统计表是由主词栏和 宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成 部分,一般都列在表的左半部分; 宾词栏是统计表用来说明总体数量特征的各 个统计指标及其数值,一般都列在统计表 的右半部分。 此外,统计表还有补充资料、注解、资料 来源、填表单位、填表人等附加内容。
2、统计表的分类ຫໍສະໝຸດ 三、统计分组的应用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
统计基础知识第二章统计调查与统计整理(娄庆松杨静主编)(精编文档).doc

【最新整理,下载后即可编辑】第二章统计调查与统计整理学习目标1.知识点:了解统计数据的来源;理解统计调查的分类;各种统计调查方法的概念、特点、适用条件;学会统计资料收集的具体操作方法;熟悉统计调查方案的内容。
了解统计整理的意义和步骤;理解统计数据的汇总和显示;掌握品质分布数列的概念、数量分布数列(变量数列)的概念和频数和频率的概念;了解统计表的结构和编制规则。
2.能力点:能够进行简单、小型的统计调查汇总的操作,掌握统计数据方法,能够根据所给资料编制品质(属性)数列和变量数列,并能够进行图形描述。
本章结构图一、我国常用的调查组织方式二、统计调查方案三、统计资料收集的具体操作方法四、统计整理五、数据处理的一般过程第一节统计调查教学目标;1.统计调查的概念与种类2.统计调查的基本要求3.我国常用的几种调查组织方式4.统计调查方案5.统计资料收集的方法6. 企业事业单位统计资料的收集7. 统计调查误差教学重难点:1. 统计调查的概念与种类2.我国常用的几种调查组织方式3. 统计调查方案4.统计调查误差教学方法:知识讲解法、举例分析法、学生自学和引导法课时安排:2课时讲授新课:一、统计调查的概念与种类(一)统计调查的概念统计调查是根据统计研究的目的和要求,采用科学的方法,有组织、有计划地针对调查对象收集统计资料的工作过程。
统计调查的基本任务是根据统计指标和指标体系,通过具体的统计调查,取得反映社会经济现象及其内在联系的原始统计资料。
统计调查担负着为整个统计工作提供基础资料的任务,统计调查中,对统计资料的采集必须做到准确、及时、全面、系统,否则,就不能很好地发挥统计认识社会的作用,甚至还会导致错误的结论,造成严重的结果。
(二)统计调查的种类二、统计调查的基本要求统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。
因此统计调查必须达到两个基本要求:准确性和及时性,以保证统计数据的质量。
统计调查的准确性、及时性是衡量统计工作质量的重要标志。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人数(人)
4 7 15 8 6
40
比重(%)
10.0 17.5 37.5 20.0 15.0
100.0
合计
按品质标志分组
统计分组
按数量标志分组
单项式分组 组距式分组
2、 正确划分各组界限 3、 简单分组与复合分组
简单分组
只按某 一个标志 分组
复合分组
用两个或两个以上的 标志进行层叠分组
某校教师按性别、职称复合分组表
1995 20.5 48.8 30.7
2000 15.9 50.9 33.2
某镇企业工人年劳动生产率 与成本利润率分组表
工人劳动生产率 (万元/人) 4以下 4 —6 6 —8 8以上
企业个数 (个) 6 16 18 5
成本利润率 (%) 15 17 20 21
三、 统计分组的方法
选择分组标志 正确划分各组界限 简单分组与复合分组
对原始资料分类、汇总 为统计分析提供系统化、条理化的综合资料
二、统计资料整理的步骤
设计整理方案 审核原始资料 对原始资料进行分组、汇总和计算 检查汇总资料 编制统计表或绘制统计图,反映汇总结果
第二节 统计分组
统计分组的含义 统计分组的作用 统计分组的方法
一、 统计分组的含义
将总体中各单位按照一定的标志划分为若 干部分(组)。
分布数列 品质数列 变量数列 单项数列 组距数列
三、 变量数列的编制
确定变量数列类型 确定组距和组限 汇总各组单位数
1、确定变量数列类型 单项数列 组距数列
思考
在什么情况下编成单项数列? 在什么情况下编成组距数列?
2、确定组距和组限
组限:即分组的数量界限,分下限和上限。
下限:毎组起点数值
组别 男性 性别 女性 合计 教授 副教授 职称 讲师 助教 合计 人数(人) 92 126 218 7 40 96 75 218 比重(%) 42.2 57.8 100.0 3.2 18.4 44.0 34.4 100.0
练习题
针对本班同学,选择一定的标志分别 设计简单分组和复合分组 。
第三节 分布数列
组别
男性 教授 副教授 讲师 助教 女性 教授 副教授 讲师 助教 合计
人数(人)
92 4 18 40 30 126 3 22 56 45 218
比重(%)
42.2 1.8 8.3 18.3 13.8 57.8 1.4 10.1 25.7 20.6 100.0
思考:
下列分组是否属于复合分组?
某校教师按性别、职称分组表
上限:毎组终点数值
组距:即毎组的距离,等于上限与下限之差。
组中值:毎组中点的数值。
下限 上限 组中值= 2
邻组组距 开口组的组中值= 下限 (缺上限) 2
邻组组距 或= 上限 (缺下限) 2
某镇居民2005年人均纯收入分组资料
人均纯收入(千元) 户数(户) 人口数(人)
3以下
3-5 5-10
3、 汇总各组单位数
练习题
1、采用组距式分组,在什么情况下,组限需 要重叠;在什么情况下,组限可以断开? 2、根据上学期某一门课程的考试成绩,将全 班学生分为以下四个组: 优秀( 85 - 100 分)、良好( 75 - 85 分)、及 格(60-75)、不及格(60分以下),并编制 成变量数列。
1、 选择分组标志
品质标志 数量标志
某班学生按性别分组表
性别 人数
15 25 40
人数比重(%)
37.5 62.5 100.0
男 女 合计
某村农户按人口数分组表 人口数(人)
1 2 3 4 5 6
户数
8 54 95 120 180 43 500
合计
某班学生按考试成绩分组表
成绩(分)
60以下 60-70 70-80 80-90 90-100
工业增加值 16.4 18.2 20.8 (百万元) 发展 111.0 114.3 环比 - 速度 (%) 定基 100.0 111.0 126.8
122.2 106.8 171.3 182.9
第三章 统计整理 教学目标
了解统计资料整理的意义和步骤 掌握统计分组的方法 掌握变量数列编制的方法 熟练掌握统计表的构成、种类及编制规则 掌握统计图的构成、种类及绘制要求
教学内容
一、统计资料整理的意义和步骤 三、统计分组 四、分布数列 五、统计资料的表现形式
第一节 统计整理的意义和步骤 一、 统计整理的含义
1570
6580 5260
7820
32800 23600
10-15
15-20 20以上
980
460 150
4700
2250 640
合计
15000
71810
组限的确定必须注意以下几点:
组限应是决定事物性质的数量界限 最低组下限应小于总体中最小变量值,最高组上限
应大于总体中最大变量值,但不应过于悬殊。 如果出现特大或特小变量值,最低组和最高组可采 用开口式。 组限一般采用整数值 对连续型变量,相邻组的组限必须重叠,按“上组 限不在内”的原则计算各组单位数。 对离散型变量,相邻组的组限可以断开,如果计量 单位是自然单位的扩大倍数,相邻组的组限必须重 叠。
第四节 统计资料的表现形式
统计表 统计图
一、统的编制规则
1、 统计表的概念
用纵横交叉的线条所组成的、用以表现统计资 料的表格。
某企业2000-2005年工业增加值发展速度
年份 2000 2001 2002 2003 23.0 110.6 140.2 2004 28.1 2005 30.0
对个体是 “合”
两层 含义
对总体是 “分”
二、 统计分组的作用
区分社会经济现象的类型 研究总体内部结构及其变化 探讨现象之间的依存关系
我国三次产业结构(%)
年份 1978 1980 产业 第一产业 28.1 第二产业 48.2 第三产业 23.7 27.4 48.5 24.1
1985 1990 28.4 43.1 28.5 27.1 41.6 31.3
分布数列的概念 分布数列的种类 变量数列的编制
一、分布数列的概念
将组别和次数依次排列所形成的数列。
我国人口性别构成分布数列
(第五次人口普查资料)
性别 男性 女性 合计
人数(人) 65355 61228 126583
比重(%) 51.63 48.37 100.00
组别
次数
(频数)
比率
(频率)
二、 分布数列的种类