第三章 统计整理与统计显示
合集下载
统计学基础(第三章统计数据整理与展示)PPT课件

• (三)两种方式的比较
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
《统计学》第3章统计数据的整理和显示

上限:一组中的较大值。 下限:一组中的较小值
• 组限
• 1、组数的多少与组距的大小有关。在全距一定时,组距 大,组数就少;组距小,组数就多。 • 2、组距的确定要根据事物的数量特征来确定。组距如果
过大,就会使性质不同的单位归并到了同一组里(破坏了
组内的同质性);组距过小,就会使同一性质的单位分到 了不同的组里(破坏了组与组之间的差异性)。
指标名称和数值)。
例
2006年某月某公司各企业劳动生产率统计表 (单位)
分组 P 总产值( 万元) 1 职工人数( 人) 2 劳动生产率 (元/人) 3
总标题
纵栏标题
横 行 标 题
大型 中型 小型 合计
数据资料 (指标数值)
主词
宾词
(1)、调查表 1、按用途分类: (2)、整理表或汇总表
(3)、分析表
或变异范围较大的离散变量。
例:学生按学习成绩分组:
按成绩分组 60分以下 人 2 数
60—70
70—80 80—90 90分以上 合 计
9
15 11 3 40
(1)、等距分组:各组的组距都相等。适用于标志值的
变动比较均匀的情况下。
(2)、异距分组:各组的组距不完全相同。适用:
a、标志值分布很不均匀
b、标志值相等的量具有不同意义
• 向上累计:由标志值小的方向向标志值大的方 向累计。 表示的意义是:该组上限以下所包含的总体单位 是多少。 • 向下累计:由标志值大的方向向标志值小的方 向累计。 表示的意义是:该组下限以上所包含的总体单位是 多少。
某班50名学生“统计学”考试成绩累计次数分布统计表
按考试 成绩分 组 60以下 60-70 70-80 80-90 90以上 合计 人数 频率( %) 4 20 24 32 20 100 向上累计 人数 2 12 24 40 50 频率 4 24 48 80 100 人数 50 48 38 26 10 向下累计 频率 100 96 76 52 20 -
• 组限
• 1、组数的多少与组距的大小有关。在全距一定时,组距 大,组数就少;组距小,组数就多。 • 2、组距的确定要根据事物的数量特征来确定。组距如果
过大,就会使性质不同的单位归并到了同一组里(破坏了
组内的同质性);组距过小,就会使同一性质的单位分到 了不同的组里(破坏了组与组之间的差异性)。
指标名称和数值)。
例
2006年某月某公司各企业劳动生产率统计表 (单位)
分组 P 总产值( 万元) 1 职工人数( 人) 2 劳动生产率 (元/人) 3
总标题
纵栏标题
横 行 标 题
大型 中型 小型 合计
数据资料 (指标数值)
主词
宾词
(1)、调查表 1、按用途分类: (2)、整理表或汇总表
(3)、分析表
或变异范围较大的离散变量。
例:学生按学习成绩分组:
按成绩分组 60分以下 人 2 数
60—70
70—80 80—90 90分以上 合 计
9
15 11 3 40
(1)、等距分组:各组的组距都相等。适用于标志值的
变动比较均匀的情况下。
(2)、异距分组:各组的组距不完全相同。适用:
a、标志值分布很不均匀
b、标志值相等的量具有不同意义
• 向上累计:由标志值小的方向向标志值大的方 向累计。 表示的意义是:该组上限以下所包含的总体单位 是多少。 • 向下累计:由标志值大的方向向标志值小的方 向累计。 表示的意义是:该组下限以上所包含的总体单位是 多少。
某班50名学生“统计学”考试成绩累计次数分布统计表
按考试 成绩分 组 60以下 60-70 70-80 80-90 90以上 合计 人数 频率( %) 4 20 24 32 20 100 向上累计 人数 2 12 24 40 50 频率 4 24 48 80 100 人数 50 48 38 26 10 向下累计 频率 100 96 76 52 20 -
第3章 统计数据的整理与显示.ppt

统计整理
将统计调查得到的原始资料进行 科学的分类和汇总,使之成为系 统化、条理化的综合资料,以反 映研究总体特征的过程。
地位
是统计调查的继续,统计分析的前 提和基础,起着承前启后的作用。
统计数据整理的一般程序 数据的预处理 数据的分组 数据的汇总
分布数列(频数分布)
(一)数据的预处理
1. 数据的审核
0~15 15~65 65以上
合计
1953年
36.3 59.3 4.4
100
1964年
40.7 55.7 3.6
100
1982年
33.6 61.5 4.9
100
1990年
27.5 66.7 5.8
100
2000年
22.9 70.1 7.0
100
(3)分析现象之间的依存关系
中国农民家庭按收入分组的恩格尔系数
▪ 检查数据中的错误
2. 数据的排序
▪ 升序和降序 ▪ 寻找数据的基本特征
3. 数据的筛选
▪ 找出符合条件的数据
数据的审核
1. 完整性与及时性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 – 检查填报单位是否按时报送了有关数据
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内 容是否符合实际
– 检查数据是否有错误,计算是否正确等
• 审核数据准确性的常用方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象
– 主要用于对分类和顺序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法 上有无错误
统计学教案(第3章统计数据的整理与显示)

组中值 上限 下限 2
组距式分组要确定并考虑组距、组数、组限、组中值等问题。组距式分组 的步骤是: (一)确定组距与组数 组距与组数互为消长,在全距一定的情况下,若组数很多,则必然组距较 小,反之,若组数少,则必然组距较大。在分组时,应避免组距过大或过小, 因为当组距过大以至组数过少时,则可能将一些性质不同的单位归并到同一 组,不能充分显示总体的特征;当组距过小以至组数过多时,则可能把性质相 同或相近的单位分散到不同的组, 也不能很好地显示总体的特征。 比如对学生 按考试成绩分为 0-60 分、60-100 分,显然分组过少,不能充分揭示学生考试
解:第 1 步:顺次点击【销售收入】单元格、 【数据】菜单、 【筛选】和【自动筛选】命 令,见图 3-2。
2
图 3-2
Excel 自动筛选命令
第 2 步:顺次点击【销售收入】标志的下拉箭头、 【自定义】 , 见图 3-3。
图 3-3
选择“自定义”命令
第 3 步:点击对话框中的下拉箭头,选择“大于或等于” ,并在其后的空格中输入 3000, 见图 3-4。单击【确定】 ,即可得到图 3-5 所示的结果。
统计学
授课题目 第 3 章统计数据的整理与显 示 授课方式 教学目的: 过本章的学习,要求明确统计整理的意义、内容和步骤;掌握统计分组的涵义及作用、正确选 择分组标志的原则及分组方法;掌握分配数列的概念、种类、编制方法;熟悉统计表的结构及设计 要求。 教学重点及难点提示: 重点为统计分组的概念、作用;正确选择分组标志的原则、方法;分配数列的编制。 难点为分组标志的选择和次数分布的特征。 案例导入:我国人口老龄化趋势不可逆转 第一节 数据整理的意义和程序 一、数据整理的意义 通过统计调查, 我们得到许多原始数据, 但这些数据是反映总体单位特征 的、 分散的、 不系统的, 为此必须对数据进行整理, 使之由 “个别” 上升到 “一 多媒体教学 般”,成为既便于储存,又便于传递的反映总体特征的资料。统计数据的整理 案例教学 是统计分析的前提,关系到整个统计工作的质量,因此,必须十分重视统计数 据的整理。 二、数据整理的程序 统计数据整理的主要内容有:数据预处理、数据的分组(类) 、汇总、整 理后的数据显示。 第二节 一、数据的审核 在分类汇总之前, 必须对原始数据进行认真的审核。 审核的内容是数据的 完整性和准确性。 所谓完整性审核, 一是审核各调查单位的调查表或调查问卷 是否汇集齐全,比如,已对 500 个学生分别发放了调查问卷,要审核是否全部 回收,如果回收不全要及时催收;若无法催收,要清点已回收的数量;若回收 的数量不能满足要求,必须进行补充调查。其次,要审核各份调查表或调查问 卷的项目是否填写齐全。 若填写不全要补充完整; 若一些缺失的重要项目无法 补充填写,视为无效调查表或调查问卷对其剔除。 所谓准确性审核, 就是审核各调查项目的填写内容是否准确。 数据的准确 性审核主要采用逻辑检查和计算检查。 逻辑检查就是根据项目之间存在的内在
组距式分组要确定并考虑组距、组数、组限、组中值等问题。组距式分组 的步骤是: (一)确定组距与组数 组距与组数互为消长,在全距一定的情况下,若组数很多,则必然组距较 小,反之,若组数少,则必然组距较大。在分组时,应避免组距过大或过小, 因为当组距过大以至组数过少时,则可能将一些性质不同的单位归并到同一 组,不能充分显示总体的特征;当组距过小以至组数过多时,则可能把性质相 同或相近的单位分散到不同的组, 也不能很好地显示总体的特征。 比如对学生 按考试成绩分为 0-60 分、60-100 分,显然分组过少,不能充分揭示学生考试
解:第 1 步:顺次点击【销售收入】单元格、 【数据】菜单、 【筛选】和【自动筛选】命 令,见图 3-2。
2
图 3-2
Excel 自动筛选命令
第 2 步:顺次点击【销售收入】标志的下拉箭头、 【自定义】 , 见图 3-3。
图 3-3
选择“自定义”命令
第 3 步:点击对话框中的下拉箭头,选择“大于或等于” ,并在其后的空格中输入 3000, 见图 3-4。单击【确定】 ,即可得到图 3-5 所示的结果。
统计学
授课题目 第 3 章统计数据的整理与显 示 授课方式 教学目的: 过本章的学习,要求明确统计整理的意义、内容和步骤;掌握统计分组的涵义及作用、正确选 择分组标志的原则及分组方法;掌握分配数列的概念、种类、编制方法;熟悉统计表的结构及设计 要求。 教学重点及难点提示: 重点为统计分组的概念、作用;正确选择分组标志的原则、方法;分配数列的编制。 难点为分组标志的选择和次数分布的特征。 案例导入:我国人口老龄化趋势不可逆转 第一节 数据整理的意义和程序 一、数据整理的意义 通过统计调查, 我们得到许多原始数据, 但这些数据是反映总体单位特征 的、 分散的、 不系统的, 为此必须对数据进行整理, 使之由 “个别” 上升到 “一 多媒体教学 般”,成为既便于储存,又便于传递的反映总体特征的资料。统计数据的整理 案例教学 是统计分析的前提,关系到整个统计工作的质量,因此,必须十分重视统计数 据的整理。 二、数据整理的程序 统计数据整理的主要内容有:数据预处理、数据的分组(类) 、汇总、整 理后的数据显示。 第二节 一、数据的审核 在分类汇总之前, 必须对原始数据进行认真的审核。 审核的内容是数据的 完整性和准确性。 所谓完整性审核, 一是审核各调查单位的调查表或调查问卷 是否汇集齐全,比如,已对 500 个学生分别发放了调查问卷,要审核是否全部 回收,如果回收不全要及时催收;若无法催收,要清点已回收的数量;若回收 的数量不能满足要求,必须进行补充调查。其次,要审核各份调查表或调查问 卷的项目是否填写齐全。 若填写不全要补充完整; 若一些缺失的重要项目无法 补充填写,视为无效调查表或调查问卷对其剔除。 所谓准确性审核, 就是审核各调查项目的填写内容是否准确。 数据的准确 性审核主要采用逻辑检查和计算检查。 逻辑检查就是根据项目之间存在的内在
统计学第三章统计数据的整理与显示

对第二手资料(获取他人的资料): 审核其完整性、准确性、适用性、时效性 2、筛选:
筛选包括: 剔除不符合要求的数据或有明显错误的数据; 将符合特定条件的数据筛选出来。
§3.1
统计整理与统计分组
★ 一、统计整理的意义和步骤 ★ 二、统计整理的基本方法
——统计分组
《统计学》第三章 统计数据的整理与显示
将总体中所有单位按一定的标志分 统计分组 为性质不同但又有联系的若干部分 的过程
统计分组的作用:
划分社会经济现象的类型
反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
Percent
有效 数据
频数
频率
有效 频率
累计 频率
约2/3的人身高不超过165cm 频数表 (用SPSS制作)
洛伦茨曲线
累计频数(频率)分布曲线,可用于分析 社会财富、土地和工资收入等的分配是否 公平的问题。该曲线图是由美国洛伦茨博 士提出,故称为洛伦茨曲线。
二、统计整理的基本方法
——统计分组
《统计学》第三章 统计数据的整理与显示
统计整理
将统计调查得到的原始资料进行 科学的分组和汇总形成综合统计 资料的工作过程(对调查资料去伪
地位
是统计调查的继续,统计分析的 前提和基础
存真、去粗取精、科学分类、浓缩简 化)
统计数据的处理:
内 容 统计资料的分组、汇总及制表
《统计学》第三章 统计数据的整理与显示
统计整理的步骤
制定统计整理方案 对原始资料进行审核 数据处理 制作统计表或统计图
(一)数据的审核与筛选 1、审核: 对 第一手资料(直接调查或试验取得):审 核其完整性与准确性 完整性审核:应调查的单位或个体是否有遗 漏;所调查的项目是否填齐全。 准确性审核:内容是否符合实际;计算是否 正确。 如:文化程度:小学 职业:大学教师
第三章统计数据的整理与展示

编制结果
组中值: 5-(10-5)/2=S2T.A5T
根据“上限不包括在内”原则,所以在
5的销~1数0售之值额间值,有(不:百应5.万0该5把元.81)06包.0括组6在.4内中6.,8值这7.里0 商店数
7.4 8.3 8.5 9.5
5以下
2.5
4
5~10 10~15 15~20
172.5.5组25中+值(:211006-25)/2=27.5 17.5 13
储蓄存款
品
活期
质 标 志
定期 财政性存款
复合 分组
分 组
活期 定期
STAT
例2 :企业职工按工龄分组
5年以下
5~10年
10~15年
数量标志分组
15~20年
20年以上
统计分组的程序与原则
选择分 组标志
确定分 组体系
总体单 位归类
科学性: 组间差异 大,组内 差异小。
完备性和互斥性: 每个单位均能且 只能归到某个组 中。
2. 时效性审核 – 应尽可能使用最新的统计数据
3. 确认是否必要做进一步的加工整理
数据的筛选
STAT
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有些
数据不符合调查的要求而又无法弥补时,需要 对数据进行筛选 3. 数据筛选的内容包括:
▪ 将某些不符合要求的数据或有明显错误的数
志作为分组标志 • 要结合现象所处的具体历史条件或经济条
件来选择分组标志
例 1 : 为了了解某地区银行存款的构成,可以选 用存款性质、期限两个标志分别进行分组
STAT
按存款性质分组 企业存款 储蓄存款 财政性存款
第三章统计数据的整理与显示

统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
统计学原理课件:第三章 统计数据的整理与显示

限不含上限”原则处理([。。))
2、不重合式
指前一组的上限与后一组的下限,两值紧密相连而不相重 复。
一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6,
7和7以上
组 中值
组中值:各组上下限的中点值,代表组内各标志值的一般水平。 重合式组限时:
3、会审汇编:将下级统计工作人员集中到上级机关, 共同审核和汇总统计资料(如:年报),可以节省时 间,随时纠正资料中的错误,交流经验,提高水平。
4、综合汇总:对各级需要的基本资料实行逐级汇总, 对调查所得的其他资料实行集中汇总(人口普查)
三、统计汇总的技术
1、手工汇总 2、电子计算机汇总
第五节 分布数列
U形分布数列
J形分布数列 J形
倒J形
按分组形式 单项式数列
组距式数列 等距数列
异距数列
按分组标志不同分为品质数列和变量数列(按 数量标志分组)
1.品质分布数列例:
按性别分组 男性 女性
合计
人数 600 400
1000
所占% 60 40
100
各组名称 次数(频数)
频率
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
n 1 3.3lg N n : 组数,N:总体单位数,d:组距,R:全距 X max:最大变量值,X min:最小变量值
N 15-24 25-44 45-89 90-179 180-359 360-719
n5
6
7
8
9
10
适用条件:
2、不重合式
指前一组的上限与后一组的下限,两值紧密相连而不相重 复。
一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6,
7和7以上
组 中值
组中值:各组上下限的中点值,代表组内各标志值的一般水平。 重合式组限时:
3、会审汇编:将下级统计工作人员集中到上级机关, 共同审核和汇总统计资料(如:年报),可以节省时 间,随时纠正资料中的错误,交流经验,提高水平。
4、综合汇总:对各级需要的基本资料实行逐级汇总, 对调查所得的其他资料实行集中汇总(人口普查)
三、统计汇总的技术
1、手工汇总 2、电子计算机汇总
第五节 分布数列
U形分布数列
J形分布数列 J形
倒J形
按分组形式 单项式数列
组距式数列 等距数列
异距数列
按分组标志不同分为品质数列和变量数列(按 数量标志分组)
1.品质分布数列例:
按性别分组 男性 女性
合计
人数 600 400
1000
所占% 60 40
100
各组名称 次数(频数)
频率
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
n 1 3.3lg N n : 组数,N:总体单位数,d:组距,R:全距 X max:最大变量值,X min:最小变量值
N 15-24 25-44 45-89 90-179 180-359 360-719
n5
6
7
8
9
10
适用条件:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)宾词简单排列是指宾词不加任何分组、按一定 顺序排列在统计表上,就是宾词简单排列表。 2)宾词分组平行排列是指宾词栏中各分组标志彼 此分开,平行排列,就是宾词分组平行排列表。
(三)统计表的设计
统计表的设计应注意如下事项: 1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以 细线绘制。表格的左右两端一般不划线,采用“开口式”。 2.合计栏的设置。 3.标题设计。以简练而又准确的文字表述统计资料的内容、 资料所属的空间和时间范围。
)
统计分组以后,掩盖了各组内部各单位的差异, 而突出了各组之间单位的差异。( )
在组距分组时,对于连续型变量,相邻两组的 组限( A )。
A、必须是重叠的
B、必须是间断的
C、可以是重叠的,也可以是间断的
( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组
二、统计图
1、直方图:用直方形的宽度和高度来表示次数分布 的图形。绘制直方图时,横轴表示各组组限,纵轴 表示次数(一般标在左方)和比率(或频率,一般 标在右方)。 2、折线图:折线图可以在直方图的基础上,用折线 将各组次数高度的坐标连接而成,也可以用组中值 与次数求坐标点连接而成 3、曲线图:用平滑曲线连接各组次数坐标点即得分 布曲线。
有一个学生考试成绩为70分,在统计
分组中,这个变量值应归入( B )。
A、60---70分这一组
B、70---80分这一组
C、60—70或70—80两组都可以 D、作为上限的那一组
某主管局将下属企业先按轻、重工业分类,
B 再按企业规模分组,这样的分组属于(
)。
A、简单分组
B、复合分组
C、分析分组
划分连续变量的组限时,相邻组的组限必 须( A )。 A、重叠 B、相近 C、不等 D、间断
复合分组是(C )。 A、用同一标志对两个或两个以上的总体层叠 起来进行分组 B、对某一总体选择一个复杂的标志进行分组 C、对同一总体选择两个或两个以上的标志层 叠起来进行分组 D、对同一总体选择两个或两个以上的标志并 列起来进行分组
统计整理的概念和原则
统计整理的方法: 分组 汇总(汇总组织形式) 编表
统计分组
含义:根据统计研究任务的要求和研究现象 总体的内在特点,把现象总体按某一标志 划分为若干性质不同但又有联系的几个部 分称统计分组。
统计分组
统计分组的原则: 穷尽原则,使总体中的每一个单位都应 有组可归,或者说各分组的空间足以容 纳总体所有的单位。 互斥原则,在特定的分组标志下,总体 中的任何一个单位的只能归属于某一组, 而不能同时或可能归属于几个组。 组内同质性和组间差异性原则
合
计
───────────────────────
A、品质分配数列 C、组距式变量分配数列 数列 E、次数分配数列
B、变量分配数列 D、等距变量分配
分配数列
1.组距 连续式分组的组距计算公式: 组距=本组上限–本组下限 间断式分组的组距计算公式: 组距=本组上限–本组下限+1
开口组的组距:以相邻组的组距为本组的组距。
2.组中值:上下限之间的中点数值称为组中值,组中值的 计算公式:
组中值
上限 下限 2
分配数列
开口组组限的计算: 缺下限开口组的组中值=上限-邻组组距/2 缺上限开口组的组中值=下限-邻组组距/2
下列数列属于( B C D E
─────────────────────── ───────────────────────
)
企业数
15 30 5 50
按生产计划完成程度分组(%)
80─90 90─100 100─110
─────────────────────—─
第三章 统计整理与统计显示
本章要点
统计整理的概念和原则 统计分组(重点) 分配数列(重点) 统计表与统计图(重点)
统计整理的概念和原则
统计整理的步骤 1)设计方案 2)统计资料的审核。 3)资料的分组和汇总。分组,即对资料按 其性质和特点,划分为若干类;汇总, 加总计算形成各项统计指标。统计分组 和统计指标是整理的中心工作。 4)编制统计表或绘制统计图。
统计整理的方法是( A、统计分组 B、划分经济类型 C、检验统计资料库 D、统计汇总 E、编制表统计
AD E
)
统计表按主词是否分组及分组的程度,可 分为( ) AC D A、简单表 B、一览表 C、分组表 D、复合表
下列分组哪些是按品质标志分组 BCDE ( ) A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按经济类型分组 E、人口按地区分组
分配数列
计算平均指标或进行其它统计分析时,常以组中值来代表 各组标志值的平均水平。 3.组数 组数=全距/组距 斯特杰斯经验公式: 组数=1+3.322Lg N 由此推出 组距=(最大变量值-最小变量值)/(1+3.322Lg N )
分配数列
累计频数分布:反映总体在某一变量值的某 一水平上总共包含的总体频数和频率
思考:变量数列和 累计频数分布各有 什么作用?
分配数列
向上累计频数(或频率)分布:先列出各组的上 限,然后由标志值低的组向标志值高的组依次累 计。向上累计频数表明某组上限以下的各组单位 数之和是多少,向上累计频率表明某组上限以下 的各组单位数之和占总体单位数比重的大小。 2、向下累计频数(或频率)分布:先列出各组的 下限,然后由标志值高的组向标志值低的组依次 累计。向下累计频数表明某组下限以上的各组单 位数之和是多少,向下累计频率表明某组下限以 上的各组单位数之和占总体单位数比重的大小。
下面哪些分组是按数量标志分组 AC D ) ( A、企业按销售计划完成程度分组 B、学生按健康状况分组 C、工人按产量分组 D、职工按工龄分组 E、企业按隶属关系分组
将某地区国有企业按产值计划完成程度分为以下四组, 哪些是正确的?( ACD )
A、第一种 100% 以下 100% ~110% 110% 以上 B、第二种 C、第三种 80 % 以下 80 % 以下 80.1% ~ 90 % 80% ~ 90 % 90.1% ~ 100% 90 % ~ 100% 100.1% ~ 110% 100% ~ 110% 110.1% 以上 110% 以上 D、第四种 85% 以下 85% ~ 95% 95% ~ 105% 105% ~ 115% 115% 以上
统计分组的关键问题是确定组距和组数
某企业职工按文化程度分组形成的分配数列是一个单
项式分配数列。(
)
连续型变量和离散型变量在进行组距式 分组时,均可采用相邻组组距重叠的方 法确定组限。( )
按数量标志分组形成的分配数列和按品 质标志分组形成的分配数列,都可称 为次数分布。( )
按数量标志分组的目的,就是要区 分各组在数量上的差异。(
分配数列
当我们所关心的是标志值较高的现象的次 数分配情况时,我们通常用次数向下累计 以表明在这些数值以上所有数值所占的比 重 当我们所关心的是标志值较低的现象的次 数分配情况时,我们通常用次数向上累计 以表明在这些数值以下所有数值所占的比 重
第一节 统计表与统计图
一、统计表 (一)统计表的定义和结构 1、统计表:把统计数据按一定的顺序排列在表格 上,就形成了统计表。它清楚地、有条理地显示 统计资料,直观地反映统计分布特征,是统计分 析的一种重要工具。
想一想:分配数 列有哪些特点
分配数列
组限:各组两端的数值 下限,上限:组距式分组的每一组变量值 中,其最小值为下限,最大值为上限 组距:上下限之间的距离 全距:变量数列中的最大值与最小值之差
分配数列
间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连(或称相重叠的), 即以同一数值作为相邻两组的共同界限的组距式 分组。 离散型变量,可间断组距式分组,也可连续组距 式分组。连续型变量,只能采用连续组距式分组。 开口式分组:同一分组中上、下限不齐全
“上限在不内”原则:以同一个数值作为相邻两 组共同的界限,统计上规定,凡是总体某一个单 位的变量值是相邻两组的界限值,这一个单位归 入作为下限值的那一组内。
分配数列
等距分组:标志值在各组保持相等的组距, 即各组的标志值变动都限于相同的范围。 一般用于标志值变动比较均匀的场合。 异距分组:各组的组距不相等。
分配数列
品质数列和变量数列 品质数列 变量数列 学生按性别分组 学生按年龄、成绩分组 男 18 60分以下 19 60-70 女 20 70-80 80-90 90以上
分配数列
单项分组与组距分组
家庭按儿童数分组 0 1 2 学生按工资分组 300---400 400---500 500---600
(二)统计表的分类
1、按主词的结构分类
1)简单表:主词未经任何分组的统计表称为简单 表,也称一览表。主词罗列各单位的名称。 2)分组表:主词只按一个标志进行分组形成的统 计表,也称简单分组表,。 3)复合表:主词按两个或两个以上标志进行分组 的统计表,也称复合分组表。
2、按宾词设计分类
D、结构分组
简单分组和复合分组的区别在于( B )。 A、选择的分组标志的性质不同 B、选择的分组标志多少不同 C、组数的多少不同 D、组距的大小不同答案
有20 个工人看管机器台数资料如下: 2,5,4,4,3,4,3,4,4,2,2,4, 3,4,6,3,4,5,2,4。如按以上资料 编制分配数列,应采用( A ) A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以
2、统计表的结构
1)从表式上看,表格包括总标题、横行标题、纵 栏标题和指标数值四个部分。 2)从内容上看,统计表由主词栏和宾词栏两个部 分组成。 主词栏是统计表所要说明的总体及其组成部分; 宾词栏是统计表用来说明总体数量特征的各个统 计指标。此外,统计表还有补充资料、注解、资 料来源、填表单位、填表人等。
(三)统计表的设计
统计表的设计应注意如下事项: 1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以 细线绘制。表格的左右两端一般不划线,采用“开口式”。 2.合计栏的设置。 3.标题设计。以简练而又准确的文字表述统计资料的内容、 资料所属的空间和时间范围。
)
统计分组以后,掩盖了各组内部各单位的差异, 而突出了各组之间单位的差异。( )
在组距分组时,对于连续型变量,相邻两组的 组限( A )。
A、必须是重叠的
B、必须是间断的
C、可以是重叠的,也可以是间断的
( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组
二、统计图
1、直方图:用直方形的宽度和高度来表示次数分布 的图形。绘制直方图时,横轴表示各组组限,纵轴 表示次数(一般标在左方)和比率(或频率,一般 标在右方)。 2、折线图:折线图可以在直方图的基础上,用折线 将各组次数高度的坐标连接而成,也可以用组中值 与次数求坐标点连接而成 3、曲线图:用平滑曲线连接各组次数坐标点即得分 布曲线。
有一个学生考试成绩为70分,在统计
分组中,这个变量值应归入( B )。
A、60---70分这一组
B、70---80分这一组
C、60—70或70—80两组都可以 D、作为上限的那一组
某主管局将下属企业先按轻、重工业分类,
B 再按企业规模分组,这样的分组属于(
)。
A、简单分组
B、复合分组
C、分析分组
划分连续变量的组限时,相邻组的组限必 须( A )。 A、重叠 B、相近 C、不等 D、间断
复合分组是(C )。 A、用同一标志对两个或两个以上的总体层叠 起来进行分组 B、对某一总体选择一个复杂的标志进行分组 C、对同一总体选择两个或两个以上的标志层 叠起来进行分组 D、对同一总体选择两个或两个以上的标志并 列起来进行分组
统计整理的概念和原则
统计整理的方法: 分组 汇总(汇总组织形式) 编表
统计分组
含义:根据统计研究任务的要求和研究现象 总体的内在特点,把现象总体按某一标志 划分为若干性质不同但又有联系的几个部 分称统计分组。
统计分组
统计分组的原则: 穷尽原则,使总体中的每一个单位都应 有组可归,或者说各分组的空间足以容 纳总体所有的单位。 互斥原则,在特定的分组标志下,总体 中的任何一个单位的只能归属于某一组, 而不能同时或可能归属于几个组。 组内同质性和组间差异性原则
合
计
───────────────────────
A、品质分配数列 C、组距式变量分配数列 数列 E、次数分配数列
B、变量分配数列 D、等距变量分配
分配数列
1.组距 连续式分组的组距计算公式: 组距=本组上限–本组下限 间断式分组的组距计算公式: 组距=本组上限–本组下限+1
开口组的组距:以相邻组的组距为本组的组距。
2.组中值:上下限之间的中点数值称为组中值,组中值的 计算公式:
组中值
上限 下限 2
分配数列
开口组组限的计算: 缺下限开口组的组中值=上限-邻组组距/2 缺上限开口组的组中值=下限-邻组组距/2
下列数列属于( B C D E
─────────────────────── ───────────────────────
)
企业数
15 30 5 50
按生产计划完成程度分组(%)
80─90 90─100 100─110
─────────────────────—─
第三章 统计整理与统计显示
本章要点
统计整理的概念和原则 统计分组(重点) 分配数列(重点) 统计表与统计图(重点)
统计整理的概念和原则
统计整理的步骤 1)设计方案 2)统计资料的审核。 3)资料的分组和汇总。分组,即对资料按 其性质和特点,划分为若干类;汇总, 加总计算形成各项统计指标。统计分组 和统计指标是整理的中心工作。 4)编制统计表或绘制统计图。
统计整理的方法是( A、统计分组 B、划分经济类型 C、检验统计资料库 D、统计汇总 E、编制表统计
AD E
)
统计表按主词是否分组及分组的程度,可 分为( ) AC D A、简单表 B、一览表 C、分组表 D、复合表
下列分组哪些是按品质标志分组 BCDE ( ) A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按经济类型分组 E、人口按地区分组
分配数列
计算平均指标或进行其它统计分析时,常以组中值来代表 各组标志值的平均水平。 3.组数 组数=全距/组距 斯特杰斯经验公式: 组数=1+3.322Lg N 由此推出 组距=(最大变量值-最小变量值)/(1+3.322Lg N )
分配数列
累计频数分布:反映总体在某一变量值的某 一水平上总共包含的总体频数和频率
思考:变量数列和 累计频数分布各有 什么作用?
分配数列
向上累计频数(或频率)分布:先列出各组的上 限,然后由标志值低的组向标志值高的组依次累 计。向上累计频数表明某组上限以下的各组单位 数之和是多少,向上累计频率表明某组上限以下 的各组单位数之和占总体单位数比重的大小。 2、向下累计频数(或频率)分布:先列出各组的 下限,然后由标志值高的组向标志值低的组依次 累计。向下累计频数表明某组下限以上的各组单 位数之和是多少,向下累计频率表明某组下限以 上的各组单位数之和占总体单位数比重的大小。
下面哪些分组是按数量标志分组 AC D ) ( A、企业按销售计划完成程度分组 B、学生按健康状况分组 C、工人按产量分组 D、职工按工龄分组 E、企业按隶属关系分组
将某地区国有企业按产值计划完成程度分为以下四组, 哪些是正确的?( ACD )
A、第一种 100% 以下 100% ~110% 110% 以上 B、第二种 C、第三种 80 % 以下 80 % 以下 80.1% ~ 90 % 80% ~ 90 % 90.1% ~ 100% 90 % ~ 100% 100.1% ~ 110% 100% ~ 110% 110.1% 以上 110% 以上 D、第四种 85% 以下 85% ~ 95% 95% ~ 105% 105% ~ 115% 115% 以上
统计分组的关键问题是确定组距和组数
某企业职工按文化程度分组形成的分配数列是一个单
项式分配数列。(
)
连续型变量和离散型变量在进行组距式 分组时,均可采用相邻组组距重叠的方 法确定组限。( )
按数量标志分组形成的分配数列和按品 质标志分组形成的分配数列,都可称 为次数分布。( )
按数量标志分组的目的,就是要区 分各组在数量上的差异。(
分配数列
当我们所关心的是标志值较高的现象的次 数分配情况时,我们通常用次数向下累计 以表明在这些数值以上所有数值所占的比 重 当我们所关心的是标志值较低的现象的次 数分配情况时,我们通常用次数向上累计 以表明在这些数值以下所有数值所占的比 重
第一节 统计表与统计图
一、统计表 (一)统计表的定义和结构 1、统计表:把统计数据按一定的顺序排列在表格 上,就形成了统计表。它清楚地、有条理地显示 统计资料,直观地反映统计分布特征,是统计分 析的一种重要工具。
想一想:分配数 列有哪些特点
分配数列
组限:各组两端的数值 下限,上限:组距式分组的每一组变量值 中,其最小值为下限,最大值为上限 组距:上下限之间的距离 全距:变量数列中的最大值与最小值之差
分配数列
间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连(或称相重叠的), 即以同一数值作为相邻两组的共同界限的组距式 分组。 离散型变量,可间断组距式分组,也可连续组距 式分组。连续型变量,只能采用连续组距式分组。 开口式分组:同一分组中上、下限不齐全
“上限在不内”原则:以同一个数值作为相邻两 组共同的界限,统计上规定,凡是总体某一个单 位的变量值是相邻两组的界限值,这一个单位归 入作为下限值的那一组内。
分配数列
等距分组:标志值在各组保持相等的组距, 即各组的标志值变动都限于相同的范围。 一般用于标志值变动比较均匀的场合。 异距分组:各组的组距不相等。
分配数列
品质数列和变量数列 品质数列 变量数列 学生按性别分组 学生按年龄、成绩分组 男 18 60分以下 19 60-70 女 20 70-80 80-90 90以上
分配数列
单项分组与组距分组
家庭按儿童数分组 0 1 2 学生按工资分组 300---400 400---500 500---600
(二)统计表的分类
1、按主词的结构分类
1)简单表:主词未经任何分组的统计表称为简单 表,也称一览表。主词罗列各单位的名称。 2)分组表:主词只按一个标志进行分组形成的统 计表,也称简单分组表,。 3)复合表:主词按两个或两个以上标志进行分组 的统计表,也称复合分组表。
2、按宾词设计分类
D、结构分组
简单分组和复合分组的区别在于( B )。 A、选择的分组标志的性质不同 B、选择的分组标志多少不同 C、组数的多少不同 D、组距的大小不同答案
有20 个工人看管机器台数资料如下: 2,5,4,4,3,4,3,4,4,2,2,4, 3,4,6,3,4,5,2,4。如按以上资料 编制分配数列,应采用( A ) A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以
2、统计表的结构
1)从表式上看,表格包括总标题、横行标题、纵 栏标题和指标数值四个部分。 2)从内容上看,统计表由主词栏和宾词栏两个部 分组成。 主词栏是统计表所要说明的总体及其组成部分; 宾词栏是统计表用来说明总体数量特征的各个统 计指标。此外,统计表还有补充资料、注解、资 料来源、填表单位、填表人等。