第三章 统计整理
第3章 统计整理

(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业
复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业
3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组
组
限
组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序
第三章 统计整理

第三章统计整理一、名词解释数据分组次数分布 (频数分布) 单变量分组组距分组组距组限组中值次数(频数)频率向上累积频数(或频率)向下累计频数(或频率)统计表二、填空1.每个组只有一个变量值的分配数列叫________,各组组距不相等的组距列叫________。
2、在组距数列中,说明总体单位数值变化界限的数值称为_____ ,各组上限与下限之间的中点数值称为_________。
3、在变量数列中,各组单位数称_______,各组单位数占总体单位总数的比重称________。
4、数据分组的原则有和____________。
5、对总体进行统计分组关键在于。
三、选择1.统计资料按数量标志分组后,处于每组两端的数值叫 ( )。
A.组距 B.组数 C.组限 D.组中值2.统计表中的主词是指 ( )A.统计表的横行标题 B.统计表的纵栏标题 C.统计表所要说明的总体 D.说明总体的统计指标3.数据整理的步骤一般为()()()()()()。
(排序)A.数据的预处理 B.编制统计数列和统计表 C.选择标志对总体进行分组 D.数据汇总E.计算和汇总 F.统计复查4.下列各项中按数量标志分组的有()()()()()。
A.人口按年龄分组 B.企业产品按合格与不合格分组C.人口按性别分组 D.家庭按月收入分组E.企业按年产值分组 F.人口按文化程度分组5.构成分配数列的两个基本要素是()()()()()。
A.组数的多少 B.各组组距大小 C.统计分组 D.各组标志值的大小E.各组次数大小 F.分配在各组的单位数6.统计表从形式上看,它是由()()()()()构成的。
A.总标题B.纵栏标题C.横行标题 D.主词E.指标数值 F.宾词第四章指标一、名词解释总体单位总数总体标志总量时期指标时点指标实物指标价值指标劳动指标算术平均数权数调和平均数几何平均数中位数众数标准差标准差系数二、简答1、简述时期指标和时点指标的概念、特点。
3第三章统计整理

(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算
第3章 统计整理与管理

第3章 统计数据的整理和管理
• • • • §3.2 统计分组 §3.2.1 统计分组的概念及作用 1. 统计分组的概念 统计分组是根据现象总体内在特点和统计研究任 务的要求,将总体按照一定标志划分为若干性质 不同又有联系的组成部分的一种统计方法。 • 例如,企业按经济类型分组,可分为:国有企业、 集体企业、个体企业和其它企业;学生按考分分 组,可分为:60分以下 (不及格)60~70分(及 格)、70~80分(中等)、80~90分(良好)和 90~100分(优秀)。
第3章 统计数据的整理和管理
• 2. 统计分组的作用 • ⑴ 划分现象的类型,通过分组将同一总体 的各个单位划分成不同的类型; • ⑵ 反映现象的内部结构,各个组中总体单 位数的多少及占总体单位数的比重反映了 总体的内部结构; • ⑶ 分析总体各部分之间的依存关系。
第3章 统计数据的整理和管理
• • • • §3.2.2 分组标志的选择 1.必须根据统计研究的目的选择分组标志。 2.必须选择能够反映现象本质的分组标志。 3.要结合现象所处的具体历史条件选择分 组标志。
三章节统计整理

27
⒈对数据进行排序
①打开 “成绩.xls” 工作簿,选定“英语成绩”工作表。 ②利用鼠标选定单元格 区域。
上一页 下一页 返回本节首页
28
③在菜单中选择“数据”中旳“排序”选项,则弹 出排序对话框。
上一页 下一页 返回本节首页
29
④在排序对话框窗口中,选择“主要关键字” 列表中旳“英语”作为排序关键字,并选择按 “递增”排序。因为所选用数据中已经包括标 题,所以在“目前数据清单”中选择 “有标题 行”,然后单击 “拟定”按钮,即可得到 排序 旳成果。
函数是其中旳一种。
上一页 下一页 返回本节首页
37
频数分布函数 (FREQUENCY) 能够对一列垂直数组返回某个区域中数据旳频数分布。
频数分布函数 (FREQUENCY)旳语法形式为: FREQUENCY(data_array,bins_array)
其中:Data_array为用来编制频数分布旳数据,Bins_array 为频数或次数旳接受区间。
3. 数据透视表
数据透视表是一种交互式工作表,用于对已经 有数据表和数据库中旳数据进行汇总和分析旳 一种工具。
上一页 下一页 返回本节首页
14
4. 统计图
Excel能够绘制许多图表,其中大部分是统计 图,可用于数据旳整顿与分析,能够直观形
象地描述现象旳数量规律性。
上一页 下一页 返回本节首页
15
第二节 统计分组与分配数列
3
第一节 统计整顿旳概念
一、统计整顿定义 二、统计整顿旳内容 三、EXCEL中统计整顿工具
上一页 下一页 返回本章首页
4
一、统计整顿旳定义
统计整顿是根据统计研究旳任务,对 统计调查所搜集到旳大量原始资料进行 加工汇总,使其系统化、条理化、科学 化,以得出反应事物总体综合特征旳资 料旳工作过程。
统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
《统计学概论》第三章 统计整理

70 ~ 80
80 ~ 90
90 ~ 100
合
计
学生人数
(人)
5 15 18 10
2 50
由表3-1可见,整理后的学生考 STAT 分资料,较整理前的考分资料明 显要条理、系统。由上表可见, 在学生总体中,60分以下和90分 以上的学生人数都较少,绝大多 数学生的考分分布在60—90分之 间。
所以,统计整理是统计调查的继续,是统计分析的前提, 它实现了从个别单位的标志表现(标志值)向总体综合指标 的过渡,在统计研究中起着承前启后重要的作用。
编制步骤:
⒈求变异全距 R X max X min 139 107 32(百万元)
⒉确定组距及组数 R≤组距(d) ×组数(m)
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
编少)
要求编制组距数列。
STAT
• 排序结果为
• 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
合计
频数(人) 3 5 8 14 10 6 4
50
频率(%) 6 10 16 28 20 12 8
100
统计分组方法
选择反映事物属性差异的标
按品质标志分组 志作为分组标志,如性别、
所有制类型
统计学(第三章)

四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计整理
一、填空题
1.统计表的结构从内容上看包括【】和【】两部分。
2.统计整理的关键在于【】。
3.分配数列按分组标志特征的不同,可分为【】数列和【】数列两种形式。
4.在组距数列中,各组上限与下限之间的中点数值称为【】。
5.某连续变量数列其末组为开口组,下限为500,又知其相邻组组中值为480, 则末组组中值为【】,如果该数列为等距数列(5个组),则首组组中值为【】。
二、单项选择题
1.按照国民收入水平分组是()
A、品质标志分组
B、复合标志分组
C、数量标志分组
D、混合标志分组
2.按某一标志分组的结果表现为()
A、组内同质性,组间差异性
B、组内同质性,组间同质性
C、组内差异性,组间同质性
D、组内差异性,组间差异性
3.某连续变量数列,其首组为开口组,上限为100,若其相邻组的组中值为130.,则首组的组中值为( )
A、60
B、70
C、80
D、90
4.在组距分组时,对于连续型变量,相邻两组的组限()
A、必须是重叠的
B、必须是间断的
C、必须取小数
D、必须取整数
5.企业按资产总额分组()
A、只能使用单项式分组
B、只能使用组距式分组
C、只能进行复合分组
D、无法进行分组
三、多项选择题:
1.选择分组标志应遵循的原则是()
A 、根据研究的目的和任务来选择
B 、选择具有现实意义的标志
C 、能反映现象的本质特征
D 、最好选择数量标志
2.从统计分组的含义来看,它意味着()
A、对总体而言是“合”
B、对总体而言是“分”
C、对个体而言是“合”
D、对个体而言是“分”
3.等距分组中()
A、各组组距是相等的
B、各组组距绝大部分是等距的
C、标志值的变动在各组之间都是相等的
D、标志值的变动在各组之间不一定相等
4.在组距数列中,组中值是()
A、上限和下限之间的中点数值
B、用来代表各组标志值的平均水平
C、在开口式分组中,可以参照相邻组的组距来确定
D、组距的一半
5.统计表从表式上看,包括()
A、总标题
B、横行标题
C、纵栏标题
D、数字资料
E、主词
F、宾词
6.在次数分配数列中,关于频率的说法正确的是()
A、用频率作权数要优于用频数作权数
B、各组频率之和等于100%
C、频率可反映各组标志值对总体的相对作用程度,其值越少,则表明该组
的标志值所起的作用越小
D、频率是各组分布次数与总次数之比
7.统计分组的作用是()
A、划分经济现象的类型
B、表明社会经济现象之间的依存关系
C、研究总体内部的结构
D、说明总体单位的特征
8.下列只能编制组距数列的有()
A、家庭按拥有微型计算机分组
B、职工按月工资额分组
C、商场按营业收入分组
D、学生按每周上网时间分组
E、城市按年地区生产总值分组
9. 统计分组的关键是()
A、确定组数B、正确选择分组标志
C、选定分组形式D、正确划分各组组限
10.某厂工人按日加工零件数(件)分为:4以下、5—9、10—14、15—19、20以上五个组,
以下说法正确的是()
A、上述分组是异限分组
B、第四组的组中值是17
C、最后一组为开口组
D、第三组的组距是5
E、第一组下限是4
四、判断题
1.按一个标志分组称简单分组,进行简单分组的统计表就叫简单表()
2.统计分组的关键问题是确定组距和组数()
3.对原始资料的审核主要包括资料的准确性、及时性和完整性三个方面()
4.离散型变量只适合于单项式分组,连续型变量只适合于组距式分组()
5.在组距数列中开口组组距一般采用相邻组组距代替()
五、应用能力题(计算结果保留两位小数)
1.从生产车间500名工人中随机抽取50名工人,50名工人的日产量如下表所示(单位;件):148 140 127 120 110 104 132 135 129 123
116 109 132 135 129 123 110 108 148 135
128 123 114 108 132 124 120 125 116 118
125 137 107 113 123 140 137 119 119 127
128 119 124 130 118 107 113 122 128 114
试根据上述资料分五个组编制分配数列,并计算各组频率,指出其分布特征(分布类型)。
2.某市某年5月粮食销售总额3000万元,其中细粮销售2000万元,细粮中的大米销售1500万元,面粉销售500万元;粗粮销售1000万元,粗粮中的玉米销售500万元,高梁销售500万元,试根据上述资料编制表明全部销售情况的统计表。