第三章 统计整理

合集下载

第3章 统计整理

第3章 统计整理



(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。


例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业

复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业

3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组


组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序

第三章 统计整理

第三章  统计整理

第三章统计整理一、名词解释数据分组次数分布 (频数分布) 单变量分组组距分组组距组限组中值次数(频数)频率向上累积频数(或频率)向下累计频数(或频率)统计表二、填空1.每个组只有一个变量值的分配数列叫________,各组组距不相等的组距列叫________。

2、在组距数列中,说明总体单位数值变化界限的数值称为_____ ,各组上限与下限之间的中点数值称为_________。

3、在变量数列中,各组单位数称_______,各组单位数占总体单位总数的比重称________。

4、数据分组的原则有和____________。

5、对总体进行统计分组关键在于。

三、选择1.统计资料按数量标志分组后,处于每组两端的数值叫 ( )。

A.组距 B.组数 C.组限 D.组中值2.统计表中的主词是指 ( )A.统计表的横行标题 B.统计表的纵栏标题 C.统计表所要说明的总体 D.说明总体的统计指标3.数据整理的步骤一般为()()()()()()。

(排序)A.数据的预处理 B.编制统计数列和统计表 C.选择标志对总体进行分组 D.数据汇总E.计算和汇总 F.统计复查4.下列各项中按数量标志分组的有()()()()()。

A.人口按年龄分组 B.企业产品按合格与不合格分组C.人口按性别分组 D.家庭按月收入分组E.企业按年产值分组 F.人口按文化程度分组5.构成分配数列的两个基本要素是()()()()()。

A.组数的多少 B.各组组距大小 C.统计分组 D.各组标志值的大小E.各组次数大小 F.分配在各组的单位数6.统计表从形式上看,它是由()()()()()构成的。

A.总标题B.纵栏标题C.横行标题 D.主词E.指标数值 F.宾词第四章指标一、名词解释总体单位总数总体标志总量时期指标时点指标实物指标价值指标劳动指标算术平均数权数调和平均数几何平均数中位数众数标准差标准差系数二、简答1、简述时期指标和时点指标的概念、特点。

3第三章统计整理

3第三章统计整理
(3)适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算

统计学第3章统计整理

统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。

月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)

《统计学概论》第三章 统计整理

《统计学概论》第三章 统计整理

70 ~ 80
80 ~ 90
90 ~ 100


学生人数
(人)
5 15 18 10
2 50
由表3-1可见,整理后的学生考 STAT 分资料,较整理前的考分资料明 显要条理、系统。由上表可见, 在学生总体中,60分以下和90分 以上的学生人数都较少,绝大多 数学生的考分分布在60—90分之 间。
所以,统计整理是统计调查的继续,是统计分析的前提, 它实现了从个别单位的标志表现(标志值)向总体综合指标 的过渡,在统计研究中起着承前启后重要的作用。
编制步骤:
⒈求变异全距 R X max X min 139 107 32(百万元)
⒉确定组距及组数 R≤组距(d) ×组数(m)
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
编少)
要求编制组距数列。
STAT
• 排序结果为
• 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
合计
频数(人) 3 5 8 14 10 6 4
50
频率(%) 6 10 16 28 20 12 8
100
统计分组方法
选择反映事物属性差异的标
按品质标志分组 志作为分组标志,如性别、
所有制类型

统计学(第三章)

统计学(第三章)

四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。

第三章统计整理

第三章统计整理
66.78% 10.33%
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分

学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .

《统计学》-第三章-统计整理

《统计学》-第三章-统计整理

第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。

在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。

2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。

3、统计分组实质上是在统计总体内部进行的一种定性分类。

4、对原始资料审核的重点是真实性。

5、区分现象质的差别是统计分组的根本作用。

6、标志是统计分组的依据,是划分组别的标准。

7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。

10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。

11、按品质标志分组的结果,形成品质分布数列。

12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。

与全距的大小成正比。

14、组距变量数列的分布可以用次数分布曲线图表示。

15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。

16、统计资料的整理方法主要有统计分组和统计汇总两种。

17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。

20、统计表从内容结构上看,是由主词和宾词两部分构成。

(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。

组内同质性,组间同质性 D。

组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三节 统计整理的具体方法
一、次数分布
(一)次数分布的概念 将总体按某一标志分组,并按一定顺序排列,把总体的所有单 位按组归并,列 出各组单位数,所形成的数列,叫分布数列。 构成要素两个: 一个是总体的分组,另一个是各组的单位数(也叫频数)或各组单位数占总 单位数的比重(也叫频率)例如:
一、次数分布
1.划分复杂现象的类型 2.研究现象的内部结构 3.分析现象间的依存关系
二、统计数据分组的方法
(一)正确选择分组标志 分组标志是将总体划分为性质不同的组的依据和标准。 1.根据统计研究目的和任务选择分组标志。 (1)选择能反映现象本质或主要特征的分组标志 (2)根据现象所处的历史条件和经济条件选择分组标志
第三章 统计整 理
– 统计表的结构,从外表形式上看,是由四部分构成 总标题 表的名称,用于概括统计表中要说明的 内容。 各组的名称,反映总体各组成部分的。 分组标志或指标的名称,说明纵行所列 各项资料的内容。 统计表的具体内容,每一项数值由相应 的横行标题和纵栏标题限定,可以是总 体单位数,也可以是标志总量,或者平 均数、相对数等,也称数字资料。
第二节 数据分组
一、统计分组的概念和作用
(一)统计分组的概念 数据分组,是根据客观事物的内在特征和统计研究的目的,选择一定标志 将客观事物划分为不同类型或不同性质的组。
1.穷尽性原则 2.互斥性原则
一、统计分组的概念和作用
(二)数据分组的作用 数据分组的根本任务是区分复杂现象间存在着的质的差别。数据分组的过 程就是区别复杂现象性质的过程。
单项式数列的编制
(三)变量数列编制方法 是指以数量标志分组时,每组只用一个变量值代表。这种分组方法通常适合于离
散型变量,且变量值较少的情况。 例3-1 某车间30名工人某日加工的零件个数统计如下: 30 30 28 29 30 31 29 30 32 29 30 27 30 29 28 31 30 27 29
组距变量数列编制步骤:
1)将变量值按由小到大的顺序排列,确定最大值、最小值,计算全距。 本例中排列结果如下(单位:%): 82 85 87 93 98 99 102 102 103 104 105 106 106 107 107 108 108 109 111 112 113 114 115 116 116 117 119 123 125 129 最大值为129%,最小值为82%。全距=最大值-最小值=129-82=47%
编制变量数列应根据统计研究的目的和统计资料的分布情况来确定其形式。
1.将原始资料按变量值的大小顺序进行排列,使之形成序列 2.根据总体分布的特征,确定组距(d)与组数(k) 3.确定组限和组限的表示方法 4.汇总计算各组次数,并编制次数分布表。
组距式数列的编制
举例说明如下: 例3-2:某企业销售部30名推销员销售额的完成情况如下:(单 位:%) 98 102 82 106 108 112 109 108 87 125 113 105 116 99 107 115 104 126 85 119 102 106 117 93 111 107 123 114 116 103 要求:编制组距数列反映推销员销售额的完成情况分布。
一、统计表
(二)统计表的作用 1.能直观、明了地表现统计资料,便于阅读; 2.便于汇总、审核,是进行统计分析的有效工具; 3.便于读者对比,从而发现现象的变化规律;
4.是积累统计资料的必要手段。
一、统计表
(三)统计表构成 1.总标题 2.横行标题 3.纵栏标题
4.数据资料
(5. 附录 ) 从内容上看,统计表由主词和宾词两部分组成。
向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和; 相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下 累计频数或向下累计频数。 向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频 率之和。
仍以例3-2为例,说明累计频数和累计频率的计算。如表3-7所示:
四、累计次数与累计频率
各组次数 频率 100% 总次数
各组累计次数 累计频率 100% 总次数
计算累计次数或累计频率。
有两种方法:向上累计和向下累计。
向上累计,是从最小变量值组开始,逐项累计各组次数或频率;表示总体 中本组上限以下的累计次数和累计频率。 向下累计,从变量值最大一组开始,逐项累计各组次数和频率,表示总体 中本组下限以上的累计次数和累计频率。
二、变量数列
(二)组距式变量数列 组距式变量数列是指按数值型变量分组后,用变量值变动的一定范围(即从 多少到多少,把一定范围内的所有变量值归为一组,范围内的距离就是组距)代 表一个组所形成的分配数列,简称组距数列。 1.组数(k) 2.组限 3.组距(d) 4.全距(R) 5.组中值(x)
三、变量数列的编制
(二)分配数列的种类 数据整理中根据分组标志特征的不同,分配数列可分为品质变量分配数列和 数值型变量分配数列。
原始数据 分组归类 数据汇总 编制次数分布表
品质数列举例
(品质数列的编制比较简单,但要注意分组时,应包括分组标志的
所有表现,不能有遗漏,各种表现相互独立,不得相融。)
例如 ,某系学生按专业分组统计如表3-4所示 。
按专业分组 学生人数(人) 比重(%)
会计学 物流 电子商务 交通安全与智能控制 计算机应用 合计
650 500 200 150 1000 2500
26 20 8 6 40 100
一、次数分布
(二)分配数列的种类 下面就如何按数值型变量进行分组并编制变量数列进行重点讨论
二、变量数列
(一)单项式变量数列 单项式变量数列是指现象按数值型变量分组后,用一个变量值代表一组而形 成的数列,简称单项数列。
统计整理
第一节 第二节 第三节 第四节 统计数据整理概述 数据分组 次数分布 统计数据的显示
第一节 统计数据整理概述
一、统计数据整理的概念和作用
按照数据采集方案的要求,运用一定的调查方式与方法实施调查,我们会得到大 量的统计数据,这些数据主要是反映个体单位特征的、且一般都是分散、零碎、杂乱 的原始资料,它难以系统地反映总体的综合数量特征,更不可能说明事物的本质和其 发展变化的规律性。
(三)对数据资料进行分组、编码和统计汇总 (1)统计分组 (2)编码 (3)统计汇总
二、数据整理的步骤
(四)编制统计表、绘制统计图 将汇总结果编制成统计表或绘制成统计图,以便直观、简明扼要地表达现 象的数量特征。该部分内容在本章统计数据显示中介绍。
二、数据整理的步骤
(五)系统积累资料 将汇总结果按需要整理成册或存入数据库,有条件的可将原始资料一并存 入数据库,以便进一步使用。
横行标题 纵栏标题 指标数值
42
从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说明 的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。
第三章 统计整 理
表3—9 某地区1999年工业总产值按轻重工业分组表
工业总产值
项目
横 行 标 题 轻工业 重工业 合计
产值(亿元) 比重(%) 3059.7 3105.7 6264.4 68.84 51.16 100.00
课堂练习 1.【资料】 分别为: 320 458 450 590 610 540 326 280 390 600 650 445 340 388 400 660 710 485 380 440 420 680 450 490 425 410 460 425 800 420 455 399 480 560 910 390 412 505 570 920 388 446 510 580 565 405 448 530 590 555 假定《当代大学生》调查50份问卷显示:“月生活费”
二、数据整理的步骤
(一)设计数据整理方案 1.根据研究目的正确选择分组标志,确定分组方法。 2.确定汇总的指标 3.确定数据汇总的具体方式。 4.确定数据审查的内容与方法。
二、数据整理的步骤
(二)对所采集的统计数据进行审核、检查、订正 1.对原始数据进行审核 2.对次级数据进行审核
二、数据整理的步骤
纵栏 标题 指标 数值
主词
宾词
43
一、统计表
(四)统计表的种类
第三章 统计整 理
1.统计表按其作用不同,可分为调查表、汇总表、分析表等。 2.统计表按主词分组情况可分为简单表、分组表和复合表
统计表的种类
简单表 分组表 复合表 主词未经过任何分组,反映出总体各单位的名称或 按时间顺序简单排列,或同时反映以上内容的统计 表。 主词按照一定标志分组的统计表,也称简单分组表。 主词按照两个或两个以上的标志层叠分组所形成的 统计表。
44
第三章 统计整 理
(五)统计表的设计规则
统计表应遵循科学、实用、简练、美观的原则进行设计。 1、统计表通常应设计成由纵横交叉线组成的长方形表格,长 宽之间应保持适当的比例。 2、统计表的总标题要用概括、简练的文字说明表的内容,并 在总标题内或在其下注明资料所属的时间、地点和单位。 3、统计表的主词各行和宾词各栏,一般应按先局部后整体的 原则排列,即先列各项目,再列总计。如果没有必要列出 所有项目时,可以先列总计,而后再列其中一部分重要的 项目。
二、统计数据分组的方法
(一)正确选择分组标志 分组标志是将总体划分为性质不同的组的依据和标准。 2. 正确划分各组的界限 (1)按品质标志分组 (2)按数量标志分组
三、分组类型
1.简单分组 简单分组是对总体只按一个标志进行的分组。
三、分组类型
2.复合分组 复合分组是对同一总体按两个或两个以上的标志重叠起来进行的分组.
故重叠分组适应所有变量。
本例中,我们可以做如下分组:80~90 120 120~130 90~100 100~110 110~
相关文档
最新文档