第三章统计整理

合集下载

第3章 统计整理

第3章 统计整理



(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。


例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业

复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业

3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组


组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序

3第三章统计整理

3第三章统计整理
(3)适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算

统计学第3章统计整理

统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。

月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)

《统计学概论》第三章 统计整理

《统计学概论》第三章 统计整理

70 ~ 80
80 ~ 90
90 ~ 100


学生人数
(人)
5 15 18 10
2 50
由表3-1可见,整理后的学生考 STAT 分资料,较整理前的考分资料明 显要条理、系统。由上表可见, 在学生总体中,60分以下和90分 以上的学生人数都较少,绝大多 数学生的考分分布在60—90分之 间。
所以,统计整理是统计调查的继续,是统计分析的前提, 它实现了从个别单位的标志表现(标志值)向总体综合指标 的过渡,在统计研究中起着承前启后重要的作用。
编制步骤:
⒈求变异全距 R X max X min 139 107 32(百万元)
⒉确定组距及组数 R≤组距(d) ×组数(m)
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
编少)
要求编制组距数列。
STAT
• 排序结果为
• 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
合计
频数(人) 3 5 8 14 10 6 4
50
频率(%) 6 10 16 28 20 12 8
100
统计分组方法
选择反映事物属性差异的标
按品质标志分组 志作为分组标志,如性别、
所有制类型

统计学(第三章)

统计学(第三章)

四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。

第三章统计整理

第三章统计整理
66.78% 10.33%
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分

学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .

统计学统计数据的整理和显示

统计学统计数据的整理和显示

组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容




统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。

统计学c第三章统计整理

统计学c第三章统计整理

合计
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
第五、绘制频数直方图和折线图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 125之间!
直方图下的面 积之和等于1
频 15

12
(人) 9
6 3 105 110 115 120 125 130 135 140 日加工零件数(个) 某车间工人日加工零件数的直方图
统计学
第三节 分布数列—变量数列
第四步,编制变量数列 某车间50名工人日加工零件数分组表 按零件数分组(件)
105~110 110~115 115~120 120~125 125~130 130~135 135~140
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
目前我国有的地方性别比为120:100,这是不正常的现象
2.划分现象的类型:如我国经济成份划分为国有经济
和非国有经济,工业化分为轻、重工业。
经济、管理类 基础课程
统计学
第二节 统计分组
3 揭示现象的内部结构:如我国人员结构、产业结构。 新交通法中,正确处理机动车司机和过路行人之间的关系 体现以人为本的理念.
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
(1)组距数列的几个常用概念
A. 组限:各组的界限,有上限和下限之分。
B. 组距:上限与下限之差 。 C. 组中值:上、下限之和的半数,即:
D. 次数密度:单位组距分配的次数。即:
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
E. 开口组与开口数列:第一组无下限或最后一组无 上 限的组称开口组。含开口组的数列称开口数列。 注意:a. 开口组的组距按相邻组的组距推算; b. 分组时正好等于组限的数应按“归下限原则”处 理。 缺上限的组中值= 下限+相临组组距的一半 缺下限的组中值= 上限—相临组组距的一半
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⑴逻辑性审查。它是利用逻辑理论检查指标之间或数据 之间有无矛盾。例如,人口调查中,少年、儿童年龄段 的居民不应有婚姻情况,文化程度不应是大学毕业以上, 职务不应是工程师以上等。如果出现已婚、高级工程师, 显然在逻辑上是不可能的,要进一步查实、更正。
上一页 下一页 返回本章首页
第三章统计整理
6
⑵比较审查法。它是指标之间进行数据比较方 式审查。例如规定某指标的数值必须大于或小 于另一指标;某几个指标之和应小于或等于总 和等。比如一个地区居民户数不能大于居民人 数;固定资产净值必须小于固定资产原值等。 凡是不符合上述规定要求的,必然是数据有问 题,必须查清。
上一页 下一页 返回本节首页
第三章统计整理
38
①打开“成绩.xls”工作簿文件。 ②在单元格E5中输入“分组”,在单元格F5中输入“频数”。 ③在E6:E10区域中依次输入59,69,79,89,99,作为频数接受
区域,它们分 别表明成绩在60分以下 的人数,成绩在60~70
分之间..,90 分以上 的人数等。 ④选定D3:D7区域,在 “插入”菜单中单击“函数” 选项,打开“粘贴函数”对 话框如图所示。
频率% 10 22 32 26 10
上一页 下一页 返回本章首页
第三章统计整理
36
㈢ 利用Excel 频数分布函数进行分组
常用函数
• 财务函数 • 数学和三角函数
• 日期与时间函数 • 统计函数
• 查找与引用函数 • 文本函数
• 数据库函数 • 逻辑函数
• 信息函数
• 工程函数
统计函数模块中有76个统计函数,这些函数 覆盖了统计基本理论与分析方法。频数分布
第三章统计整理
18
统计分组的作用
⒈划分现象的类型 ⒉揭示现象内部结构 ⒊分析现象之间的依存关系
上一页 下一页 返回本章首页
第三章统计整理
19
二、分组标志的选择
➢ ㈠按品质标志分组 如按性别分组,见表3-5
表 3-5 某班学生的性别构成情况
按性别分组 男 女
合计
绝对数人数 30 10 40
比重(%) 75 25 100
24.6
55岁以上(老年组)
8.1
合计
51.7
上一页 下一页 返回本章首页
第三章统计整理
26
㈡组距数列的编制
建立频数分布的步骤如下: • 先对数据进行排序,以了解全部数据的变动
范围; • 选择全部数据的分组组数; • 确定分组的组限, • 最后对各组数值所出现的频数进行计数。 ➢ 例:有某班学生英语考试成绩如下
第三章统计整理
34
开口组组中值的确定 缺下限开中组组中值=上限-邻组组距/2 缺上限开中组组中值=下限+邻组组距/2
上一页 下一页 返回本章首页
第三章统计整理
35
➢ ⒋确定频数和频率 频数=每组单位数 频率=每组频数/总单位数
组限
频数
60以下 5
60~70 11
70~80 16
80~90 13
90分以上 5
上一页 下一页 返回本章首页
第三章统计整理
31
➢ ⒊确定组限和组中值 每组两端的数值称为组限 第一组下限=48 第一组上限=48+8=56 第二组下限=56 第二组上限=56+8=64 为避免重复,一般规定:上组限不在内 组中值=(上限+下限)/2 上一页 下一页 返回本章首页
第三章统计整理
32
表示时,可写成
上一页 下一页 返回本节首页
第三章统计整理
39
⑤在“函数分类”列表中选择“统计”,在“函数名” 列表中选择“FREQUENCY”,单击“确定”按钮, Excel弹出“频数分布”对话窗口。
上一页 下一页 返回本节首页
第三章统计整理
40
⑥在数据区域“Data_array”中输入单元格B2:B51
数据接受区间Bins_array 中输入单元格E5:E10,在对话 窗口中可以看到其相应的频数是5,11,16,13,5,。
上一页 下一页 返回本章首页
第三章统计整理
8
发现数据差错以后,要分别不同情况及时纠正与 处理,属于被调查单位填报错误的,应通知他 们重新填报,属于汇总过程中的错误,应根据 情况,予以修正。
2.录入数据,建立数据表
• 数据表是指包含相关数据的一系列工作表的 数据行。
• 数据表可以作为数据库使用,其中行表示记 录,列表示字段。
上一页 下一页 返回本章首页
第三章统计整理
22
三、分配数列
➢ ㈠分配数列的概念与种类 在统计分组的基础上,将总体的所有单位按组
归类整理,并按一定顺序排列,形成总体中各个单 位在各组间的分布,称为次数分配(布)或分配数列。
分布在各组的个体单位数叫次数或频数,各组 次数占总次数的比重叫频率。
上一页 下一页 返回本章首页
函数是其中的一个。
上一页 下一页 返回本节首页
第三章统计整理
37
频数分布函数 (FREQUENCY) 可以对一列垂直数组返回某个区域中数据的频数分布。
频数分布函数 (FREQUENCY)的语法形式为: FREQUENCY(data_array,bins_array)
其中:Data_array为用来编制频数分布的数据,Bins_array 为频数或次数的接收区间。
50~60
2
5.0
60~70
7
17.5
70~80
11
27.5
80~90
12
30.0
90~100
8
20.0
合计
40
100.0
上一页 下一页 返回本章首页
第三章统计整理
25
表3-9 某地区人口分布状况
人口按年龄分组人口Βιβλιοθήκη (万人)1岁以下(婴儿组)
1
1~7岁(幼儿组)
6
7~17岁(学龄儿童组)
12
18~55岁(有劳动能力的人口组)
⑦由于频数分布是数组操作,
所以,此处不能直接单 击“确定”按钮,而应按 Ctrl +Shift+回车键,得 到频数分布如图所示。
分组 频数
59
5
69
11
79
16
89
13
99
5
上一页 下一页 返回本节首页
第三章统计整理
41
四、统计分组体系
在统计研究中,为了全面认识某一社会 经济现象,常常运用多个分组标志对总 体进行分组,形成一系列相互联系、相 互补充的分组体系。就整个国民经济总 体而言,通过按所有制、部门、行业、 地区、管理等多种分组,形成国民经济 分组体系。
上一页 下一页 返回本节首页
第三章统计整理
14
4. 统计图
Excel可以绘制许多图表,其中大部分是统计 图,可用于数据的整理与分析,能够直观形
象地描述现象的数量规律性。
上一页 下一页 返回本节首页
第三章统计整理
15
第二节 统计分组与分配数列
一、统计分组的定义和作用 二、分组标志的选择 三、分配数列
上一页 下一页 返回本章首页
第三章统计整理
16
一、统计分组的定义和作用
统计分组就是根据统计研究的需要,将统计 总体按照一定的标志区分成若干组成部分的 一种统计方法。
在第一章中我们已经讲述过“变异”的概念,就是 说在一个总体中,单位的品质标志或数量标志,其 标志表现可能是互不相同的,总体内部各个单位间 存在许多的变异标志又是人们把总体进一步分为性 质不同的几个部分的客观依据。
上一页 下一页 返回本节首页
第三章统计整理
13
2. 频数分布函数
频数分布函数是Excel 的一个工作表函数,是编 制次数分布的主要工具,通过频数分布函数, 可以对数据进行分组与归类,从而使数据的分 布形态更加清楚地表现出来。
3. 数据透视表
数据透视表是一种交互式工作表,用于对已有 数据表和数据库中的数据进行汇总和分析的一 种工具。
上一页 下一页 返回本章首页
第三章统计整理
27
⒈对数据进行排序
①打开 “成绩.xls” 工作簿,选定“英语成绩”工作表。 ②利用鼠标选定单元格 区域。
上一页 下一页 返回本节首页
第三章统计整理
28
③在菜单中选择“数据”中的“排序”选项,则弹 出排序对话框。
上一页 下一页 返回本节首页
第三章统计整理
4
一、统计整理的定义
统计整理是根据统计研究的任务,对 统计调查所搜集到的大量原始资料进行 加工汇总,使其系统化、条理化、科学 化,以得出反映事物总体综合特征的资 料的工作过程。
上一页 下一页 返回本节首页
第三章统计整理
5
二、统计整理的内容
⒈对原始资料进行审核与检查。审核、检查被调查单位 的资料是否齐全,有无迟报、不报、漏报的情况;如果 报送已齐全,应审查有无差错。审查的办法主要有:
29
④在排序对话框窗口中,选择“主要关键字”
列表中的“英语”作为排序关键字,并选择按 “递增”排序。由于所选取数据中已经包含标 题,所以在“当前数据清单”中选择 “有标题 行”,然后单击 “确定”按钮,即可得到 排序 的结果。
上一页 下一页 返回本节首页
第三章统计整理
30
⒉确定组距和组数 全距=上限-下限=96-48=48 组数 一般5-7组 组距=全距/组数 例 如分6组,组距=48/6=8
上一页 下一页 返回本章首页
第三章统计整理
17
统计分组,对总体而言是“分”(分为 范围更小的总体),而对总体单位而言 是“合”(合为性质相同的组);对分 组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而 对其它标志来说又是“合”(其它标志 表现的差异不考虑了)。
相关文档
最新文档