第三章 统计整理 高教社统计学概论第五版课件

合集下载

统计学原理-统计整理

统计学原理-统计整理

统计整理的意义
统计调查所搜集的反映个体量的原始资料是分散 的,不是集中的;是零碎的,不是系统的。根据这 些资料。人们难以从总体上分析和认识现象的数量 表现。
至于某些已经加工的综合资料,则往往由于资料在 分组方法、总体范围或指标涵义、口径、计算方法 等方面不同,而不能满足统计分析的要求,也必须 先通过统计整理,才能据以从总体上分析社会经济 现象的数量表现,
一、统计分组的意义和作用

统计分组的作用
⒈区分社会经济现象的类型-类型分组 ⒉研究现象的内部结构-结构分组 ⒊分析现象之间的依存关系-分析分组
某地区2008年底各类工业企业数 按所有制性质分组 企业数(个) 比重(%) 全民所有制企业 集体所有制企业 3204 1286 64.08 25.72
私营企业 中外合资企业 外商独资企业
二、统计分组的要求和方法

统计分组的方法
2、按品质标志和数量标志分组
经调查 ,某地年末货币流通量为 15.3亿元,比上年增加 4.5亿元。
按地区分组 甲县 乙县 丙县 丁县 合计 上期 36000 24000 28000 20000 108000 本期 52000 34000 41000 26000 153000 增减% 44.4 41.7 46.7 30.0 41.7
第三节 变量数列
一、变量数列的概念 分 类
品质标志数列
数量标志数列
连续型变量数列
离散型变量数列 单项数列 组距数列 等距数列 异距数列
按品质标志分组—品质数列,一般是单项式分组
某班学生的性别构成情况 按性别分组 男 女 合计 绝对数人数 30 10 40 比重(%) 75 25 100
某厂第二季度工人平均日产量 工人数 绝对数 比重(%) 10 15 30 40 20 115 8.7 13.0 26.1 34.8 17.4 100

3第三章统计整理

3第三章统计整理
(3)适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算

高等数学第三章 统计数据的整理

高等数学第三章  统计数据的整理
log10 k 1 2 log10
第三步:将分组结果整理成频数分布表 注: 1.根据需要,实际中往往还有更复杂的分组 方法。如复合分组法。 2.不管何种分组方法,都要遵循“不重不漏” 的原则。为解决“不重”的问题,在分组 时必须做到:“下组限在内”或“上组限 不在内”
五、频数分布表 1.频数分布表的结构及组成要素 例1.某生产车间50名工人日加工零件数如下 (单位:个)
100 94 84 68 40 20 8 --
六、统计表 统计表是用来显示统计资料的基本工具。 以上调查表、频数分布表都是统计表。 (一)统计表的作用(优点) 1.能使统计资料条理化 2.比用叙述的方式表现统计资料更简明易懂, 节省篇幅 3.便于比较各项目之间的关系,便于计算 4.便于检查统计数字的完整性和正确性
二、数据的预处理 统计整理的步骤:审核、筛选、排序、分组 (类)、频数分布表(图) 1.审核 对于第一手资料: 1)完整性(两方面) 2)准确性(两方面) 对于第二手资料: 1)完整性 2)准确性 3)适用性 4)时效性
2.筛选 1)剔除 2)挑出 3.排序 1)升序 2)降序
第二节 统计分组(类) 是根据现象总体内在特点和统计工作任务 的要求,按照某种标志,把总体划分为不同 类型或者性质不同的几部分的一种统计方 法。
单位:%
转移性 收入 3.5 3.7 4.0 3.7 3.9 4.5
表2
家庭人均生活费与就业人品数依存关系
平均每户就业人数(人) 1.78 1.96 2.12 2.33 2.59 2.82
按人均月生活费分组(元) 200以下 200-250 250-350 350-500 500-600 600以上
107 117 121 124 127 134 108 117 122 124 128 135 108 117 122 124 128 137 110 118 122 125 129 139 112 118 122 125 130 139 112 118 123 126 131 113 119 123 126 133 114 120 123 127 133 115 120 123 127 134

统计学第3章统计整理

统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。

月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)

【统计学 精品课件】第3章 统计数据的整理与显示

【统计学 精品课件】第3章 统计数据的整理与显示
• 按数量标志分组应注意如下两个问题:①分组时各组数 量界限必须能反映事物质的差别。②应根据被研究的现 象总体的数量特征,采用适当的分组形式,确定适当的 组距、组限。
• 1.单项式分组与组距式分组
• 单项式分组就是用一个变量值作为一组,形成单项式变量 数列。
• 单项式分组一般适用于离散型变量且变量变动范围不大的 场合。
• 3.统计表的分类 • (1)按主词的结构分类,根据主词是否分组和 分组的程度,分为简单表、分组表和复合表
• (2)按宾词的设计分类,可分为宾词简单排列、 分组平行排列和分组层叠排列三种
• 3.统计表的设计 • (1)标题设计 • (2)线条的绘制 • (3)合计栏的设置 • (4)指标数值 • (5)计量单位 • (6)注解或资料来源

(3k-2)1 3.22lg N

d R xmax xmin
• (3-3)
k 1 3.22 lg N
• 式中:k为组数;N为总体单位数;d为组距;R为全距, 即最大变量值xmax与最小变量值xmin之差。
• 上下限之间的中点数值称为组中值,组中值的计算公式
为: •
组中值 上限+下限 2
• 当研究目的在于探讨总体在某一标志上的构成,而将总体 划分为若干组成部分以显示所研究标志的结构时,这种分 组称为结构分组。
• (3)可以揭示现象之间的依存关系
• 当研究目的在于探讨同一总体范围内两个可变标志的依存 关系时,可以将其中一个可变标志(自变量)作为分组标 志,以观察另一标志(因变量)相应的变动情况。这种分 组称为分析分组,它可以揭示现象之间的依存关系。
• 按品质标志分组编制的分布数列叫做品质分布数列或属 性分布数列,简称为品质数列。

统计学c第三章统计整理

统计学c第三章统计整理

合计
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
第五、绘制频数直方图和折线图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 125之间!
直方图下的面 积之和等于1
频 15

12
(人) 9
6 3 105 110 115 120 125 130 135 140 日加工零件数(个) 某车间工人日加工零件数的直方图
统计学
第三节 分布数列—变量数列
第四步,编制变量数列 某车间50名工人日加工零件数分组表 按零件数分组(件)
105~110 110~115 115~120 120~125 125~130 130~135 135~140
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
目前我国有的地方性别比为120:100,这是不正常的现象
2.划分现象的类型:如我国经济成份划分为国有经济
和非国有经济,工业化分为轻、重工业。
经济、管理类 基础课程
统计学
第二节 统计分组
3 揭示现象的内部结构:如我国人员结构、产业结构。 新交通法中,正确处理机动车司机和过路行人之间的关系 体现以人为本的理念.
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
(1)组距数列的几个常用概念
A. 组限:各组的界限,有上限和下限之分。
B. 组距:上限与下限之差 。 C. 组中值:上、下限之和的半数,即:
D. 次数密度:单位组距分配的次数。即:
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
E. 开口组与开口数列:第一组无下限或最后一组无 上 限的组称开口组。含开口组的数列称开口数列。 注意:a. 开口组的组距按相邻组的组距推算; b. 分组时正好等于组限的数应按“归下限原则”处 理。 缺上限的组中值= 下限+相临组组距的一半 缺下限的组中值= 上限—相临组组距的一半

统计学第三章 统计数据的整理

统计学第三章 统计数据的整理

汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计

统计学第三章 统计整理与显示(2017)

统计学第三章 统计整理与显示(2017)

Statistics
(二)统计分组:分类
将统计总体按照一定的标准分成若干类(或组), 这是分类法在统计中的具体应用。
统计分组是统计整理的基础,分组科学与否直接 影响到统计整理工作的质量。
Statistics (三)统计汇总:加总,求合计 数 • 在分组的基础上采用适当的汇总组织形式和技 术方法,按分组要求对原始资料进行汇总综合, 计算各组及总体的单位数和标志总量。 • 统计汇总是统计整理的中心内容
Statistics
1、根据统计研究的目的选择 2、选择具有本质性的重要标志(抓主要 矛盾) 3、结合现象所处的具体条件
Statistics 四、统计分组的种类
(一)按分组标志的性质不同分 1、按品质标志分组
如:学生按性别分组,企业按所有制性质分组等
《工业部门分类目录》、《主要商品目录》等,以统一 全国的分类口径,便于各部门掌握和使用。
工人按日产量(件)分组 工人数(人) 2 5 3 10 4 3 18 合计
2、组距数列: Statistics 适合于连续变量 适合于变量值较多的情况 可采用等距分组,也可采用不等距分组 表3.6 学生按成绩分组
学生按成绩分组 学生数(人) 3 60以下 60——70 7 70——80 20
80——90 90以上 合 计
Statistics
2、分布数列的构成:
由两部分构成:(1)各组 (2)各组次数(或频率)
3、分布数列的种类:根据分组标志的不同可分为:
品质分布数列:可用条形图、圆形图等表示 数量分布数列:简称为变量数列
Statistics
(1)品质分布数列
• 按品质标志分组编制的分布数列,简称 品质数列。如
Statistics
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档