第三章 统计调查与整理

合集下载

第三章 统计资料的收集与整理

第三章 统计资料的收集与整理

间 50 名 工 人 日 加 工零件数如下(

108 131
125
117 122
133
126 122
118
108
单 位 : 个 ) 。 试 110 118 123 126 133 134 127 123 118 112
采用单变量值对 数据进行分组。

112 134
127
123 119
113
120 123
2. 普查
全面调查
3. 抽样调查
4. 重点调查
非全面调查
5. 典型调查
统计报表
统计报表(Statistical Report Forms) 是指依照国家统计局或国家各行政管理部 门的规定,自上而下地统一布置,以一定 的原始记录为依据,按照统一的表式,统 一的指标项目,统一的报送时间与报送程 序,自下而上地逐级定期提供基本统计资 料的一种调查方式。
1. 用于显示未分组的原始数据的分布
2. 由“茎”和“叶”两部分构成,其图形是由数字组 成的
3. 以该组数据的高位数值作树茎,低位数字作树叶
4. 对于n(20≤n≤300)个数据,茎叶图最大行数不超过

L = [ 10 × log 10 n ]
5. 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值
例题1 例题2 扩展表
例题
扩展表
统计表的结构
从形式来看要素包括:总标题、横行标题、纵行标题、 数字资料。 表示统计研究的对象,称主词 ;其余的是宾词。
表例1
表例2
表例3
图例1
图例2
频数分布表的编制
(实例)

第3章 统计整理

第3章 统计整理



(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。


例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业

复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业

3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组


组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序

3第三章统计整理

3第三章统计整理
(3)适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算

统计学第3章统计整理

统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。

月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)

统计学(第三章)

统计学(第三章)

四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。

第三章统计整理

第三章统计整理
66.78% 10.33%
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分

学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .

第三章 统计调查与 统计整理课件

第三章 统计调查与 统计整理课件

开口组组中值的计算限―
邻组组距 2
• 缺上限的组中值: 缺上限的开口组组中值 = 下限 +
邻组组距 2
如:组距d=U-L 组距 =100-50=50(万 ( 元)
例:某地区100个百货商店 某地区100个百货商店 月销售额与流通费用情况
每百元商品销 销售额 商店数 售额中支付的 万元) (万元) (个) 流通费( 流通费(元) 上组限U 上组限 10 14.2 50以下 50以下 20 11.4 50~100 ~ 30 10.1 100~200 ~ 25 9.2 200~300 ~ 下组限L 下组限 300以上 15 8.5 以上
单项数列 组距数列
等距数列 异距数列
品质数列的编制
中国体育代表团在悉尼 奥运会上获金牌的项目
射击 射击 体操 体操 乒乓球 举重 乒乓球 羽毛球 举重 乒乓球 羽毛球 举重 举重 跳水 跳水 跳水 乒乓球 跳水 射击 体操 羽毛球 柔道 柔道 举重 田径 羽毛球 跆拳道
品质数列的编制
获金牌项目
品 质 数 列
按数量标志分组的形式 单项式分组
单一的数值作为分组标志的分 指用单一的数值 指用单一的数值作为分组标志的分 每个数值作为一个组。 组。每个数值作为一个组。
如某班学生按年龄分组: 岁 如某班学生按年龄分组:17岁,18岁,19岁, 岁 岁 20岁, 21岁,22岁。 岁 岁 岁
组距式分组
将作为分组依据的数量标志的整个取 将作为分组依据的数量标志的整个取 值范围依次划分为若干个满足互斥性 值范围依次划分为若干个满足互斥性 和包容性的区间,用这些数值区间 数值区间作 和包容性的区间,用这些数值区间作 为组的名称。 为组的名称。 60分以下 分以下 如某班学生统 60—70分 分 分 计学成绩分组 70—80分 80—90分 分 90分以上 分以上

《统计学》-第三章-统计整理

《统计学》-第三章-统计整理

第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。

在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。

2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。

3、统计分组实质上是在统计总体内部进行的一种定性分类。

4、对原始资料审核的重点是真实性。

5、区分现象质的差别是统计分组的根本作用。

6、标志是统计分组的依据,是划分组别的标准。

7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。

10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。

11、按品质标志分组的结果,形成品质分布数列。

12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。

与全距的大小成正比。

14、组距变量数列的分布可以用次数分布曲线图表示。

15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。

16、统计资料的整理方法主要有统计分组和统计汇总两种。

17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。

20、统计表从内容结构上看,是由主词和宾词两部分构成。

(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。

组内同质性,组间同质性 D。

组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
返回首页
2013-11-23 第二章 统计调查和整理 14
(三)等距数列与异距数列
1、等距数列:每个组的组距都相等的
组距数列。如表2—10。 2、异距数列:各组的组距不尽相等。
返回首页
2013-11-23 第二章 统计调查和整理 15
表2—10 某班学生统计学考试成绩表
考分 人数(人)比重(%) 50~60 2 5.0 60~70 7 17.5 70~80 11 27.5 80~90 12 30.0 90~100 8 20.0 合计 40 100.0
100~499人
500~999人 1000~2999人
3000人以上
说明分组的标志变量是离散型的还是连续型 的,属于什么类型的组距数列。
2013-11-23 第二章 统计调查和整理 19
小结: 作业:
2013-11-23
第二章 统计调查和整理
20
3.下面是某公司工人月收入水平分组情况和各 组工人数情况: 月收入(元) 工人数(人) 400~500 20 500~600 30 600~700 50 700~800 10 800~900 10 说明分组的标志变量是离散型的还是连续型
6
返回首页
组距数列举例 表2—9
工人按完成生产定额分 组(%) 80—90 90—100 100—110 110—120 120—130 合计
2013-11-23
工人数 绝对数 比重(%) 30 16.7 40 22.2 60 33.3 30 16.7 20 11.1 180 100
返回首页 第二章 统计调查和整理
的,属于什么类型的组距数列。
第二章 统计调查和整理
2013-11-23
21
Thank you very much!
返回本章首页
2013-11-23 第二章 统计调查和整理 22
返回本章首页
2

1、分配数列的概念 概念:在统计分组的基础上,将总体中所有单位 按组归类整理,形成总体中各单位在各组间的分 布,就叫 次数分布,又称分配数列。 a. 在分配数列中分配在各组的单位数叫次数, 或者频数。 b. 各组次数与总次数的比率叫做频率。
返回本节首页
2013-11-23
第二章 统计调查和整理
3
2、分配数列的种类
构成要素
总体按标志所分的组(各组名称) 各组所分的单位数(次数或频率)
分 类
品质数列 变量数列 单项数列 组距数列
第二章 统计调查和整理返回本节首页
2013-11-23
4
品质数列举例
我国大陆人口的性别分布(1998年末)
性别 男性 女性 合计

2013-11-23
人数(万人) 63629 61181 124810 各组名称
2013-11-23 第二章 统计调查和整理 17
习题: 1. 某连续变量数列,其末组为开口组,
下限为500,又知其邻组的组距为40, 则末组的组中值为( ) ①520 ②510 ③500 ④490。
2013-11-23
第二章 统计调查和整理
18
2. 1.某地区工业企业按职工人数分组如下: 100人以下
7
练习一(单选) 统计分配数列(

①都是变量数列
②都是品质数列
③是变量数列或品质数列
④是统计分组。
第二章 统计调查和整理
2013-11-23
8
练习二(单选) 学生成绩分组是( ) ①品质标志分组 ②数量标志分组 ③复合标志分组 ④混合标志分组。
2013-11-23 第二章 统计调查和整理 9
思考: 想了解财会十八班《统计基础知识》的 期中考试成绩的层次结构,分析优良差。
2013-11-23
第二章 统计调查和整理
1
第四节 分配数列
教学目标: 一、理解分配数列的概念和种类 1、分配数列的概念 2、分配数列的分类 二、掌握几组重要的统计概念 1.组数 组限 组距 2.组中值计算
2013-11-23 第二章 统计调查和整理
返回
13
组中值举例
按完成净产值分组(万元)
10以下 10—20 20—30 30—40 40—70 70以上 缺下限: 组中值 = 10—10/2=5 组中值 =(10+20)/2=15 组中值 =(20+30)/2=25 组中值 =(30+40)/2=35 组中值 =(40+70)/2=55 缺上限:组中值 =70+30/2=85
练习三(多选) 5.分布数列的两个组成要素为(
)
①品质标志 ②数量标志 ③分组 ④次数 ⑤分组标志
2013-11-23 第二章 统计调查和整理 10
二、几组重要的概念
(一)组数、组限、组距 (二)组中值
(三)等距数列与异距数列
返回本节首页
2013-11-23 第二章 统计调查和整理 11
下一页
2013-11-23 第二章 统计调查和整理
返回首页
16
表2-11 某地区人口分布状况 人口按年龄分组 人口数(万人) 1岁以下(婴儿组) 1 1~7岁(幼儿组) 6 7~17岁(学龄儿童组) 12 18~55岁(有劳动能力的人口组) 24.6 55岁以上(老年组) 8.1 合计 51.7
返回首页
返回首页
12
(二)组中值
组中值:组距数列中各组所有变量值的代表 值,实际上就是各组上限与下限之间的中点 值。 计算公式为:
闭口组:
组中值
上限 下限 2
缺下限的开口组: 组中值 上限 邻组组距
2
缺上限的开口组:组中值 下限 邻组组距
2
2013-11-23
举例 第二章 统计调查和整理
(一)组数、组限、组距
1、组数:指变量数列共分多少组。如表2— 10、表2—11。 2、组限:指各组的数量界限。分为上限 和下 限。如表2—10、表2—11。 3、组距:各组所包含的变量值的变动范围。 组距=上限—下限 如表2—10、表2—11。 4. 全距:变量值中最大值与最小值的差。
2013-11-23 第二章 统计调查和整理
比率(%) 50.98 49.02 100
次数或频数
频率(比重)
5
第二章 统计调查和整理 返回首页
单项列举例 表2—8
工人数 工人平均日产量(件) 2 3 4 5 6 合计
2013-11-23
绝对数 10 15 30 40 20 115
第二章 统计调查和整理
比重 (%) 8.7 13.0 26.1 34.8 17.4 100.0
相关文档
最新文档