第3章 统计数据的整理

合集下载

3第三章统计整理

3第三章统计整理
(3)适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算

第三章 统计资料整理

第三章  统计资料整理

2.分组表: 2.分组表:主词按一个标志分组的统计表. 分组表
复合表: 3. 复合表:主词按两个或两个以上标志复合 分组的统计表. 分组的统计表.
四,统计表的编制原则
应遵循科学,实用,简明,美观的原则. 应遵循科学,实用,简明,美观的原则. 统计表的各种标题要简明扼要; 1.统计表的各种标题要简明扼要; 要合理安排统计表的结构; 2.要合理安排统计表的结构; 数据计量单位相同时,可放在表的右上角标明, 3. 数据计量单位相同时 , 可放在表的右上角标明 , 不同 时应放在每个指标后或单列出一列标明; 时应放在每个指标后或单列出一列标明; 表中的上下两条横线一般用粗线,其他线用细线; 4.表中的上下两条横线一般用粗线,其他线用细线; 5.统计表的栏数较多时,通常要加以编号; 统计表的栏数较多时,通常要加以编号; 通常情况下,统计表的左右两边不封口; 6.通常情况下,统计表的左右两边不封口; 表中的数字应该填写整齐,对准位数; 7.表中的数字应该填写整齐,对准位数; 对于没有数字的表格单元,一般用" 表示; 8.对于没有数字的表格单元,一般用"—"表示; 表中主词各行和宾词各栏, 9. 表中主词各行和宾词各栏 , 应按先局部后整体的原则 排列; 排列; 10.必要时可在表的下方加上注释. 10.必要时可在表的下方加上注释.

编制
四,次数分布的主要类型 钟型分布——"两头小,中间大" 两头小,中间大" 钟型分布 两头小
对称分布
右偏分布
左偏分布
两头大, U型分布——"两头大,中间小" 型分布 两头大 中间小"
U型分布
一边小, J型分布——"一边小,一边大" 型分布 一边小 一边大"

统计学第3章统计数据整理与显示

统计学第3章统计数据整理与显示
第三章
2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21

统计学原理 第三章 数据整理与显示

统计学原理 第三章 数据整理与显示

4.数量(变量)分组
如,企业按产值分组
按数量标志进行的分组。
100万元以下 100 ~ 500 500 ~ 1000 1000万元以上
单项式分组 数量(变量)分组 组距式分组
单项式分组: 在变量分组中, 一个组只有一个变量值。
如,居民家庭按子女数分组: 0 1 2 3 单项式分组适用于变量值变化范围不大、不同变量值个数 较少的离散型变量的场合。
10
22
20
22
30
27
主要步骤:数据------数据透视表------布局
EXCELL应用:单项式分组及汇总 日产量 22 23 24 25 26 工人人数 6 8 10 1 3 比重 20.00% 26.67% 33.33% 3.33% 10.00%
27
总计
2
30
6.67%
100.00%
主要步骤:数据------数据透视表------布局
600 ~ 700 700 ~ 800 800 ~ 1200 1200 ~1500
组 限 重 叠
499以下 500 ~ 999 1000 ~ 1999 2000 ~ 2999 3000及以上
组 限 不 重 叠
组限的划 分方法
不重叠组限(只适用于离散型变量) 重叠组限(适用于连续型变量和离散型变量)
当为重叠组限时,交叉组限值遵循 “上限不在其内”的原则。
它适用于变量值变化范围较大、不同变量值个数较多 的离散型变量及连续型变量的情形。
组距式分组最为常见,进行分组涉及以下几个问题
(1)组限及划分方法
(2)组距与组数 (3)等距分组与不等距分组 (4)组中值
组距式分组的组限及划分方法
每组起点值称为上限,终点值称为下限。 工人按工资分组: 企业按人数分组:

统计学 第3章 统计数据的整理与显示答案

统计学 第3章  统计数据的整理与显示答案

第3章统计数据的整理与显示
习题参考答案
一、单项选择题
1.B 2.A 3.B 4.C 5.C 6.D 7.D 8.C 9.A
10.C 11.A 12.B 13.B 14.C 15.A 16.D 17.A 18.A
二、多项选择题
1.ABE 2.BCD 3.BCD 4.CD 5.ACD 6.BCD
7.ABCE 8.ABCDE 9.BDE 10.BC
三、判断题
1、×
2、√
3、×
4、×
5、×
6、×
7、×
8、√
9、√10、×11.√12.×
13.×14.×15.√
四、填空题
1.中间环节
2.制定方案、审核纠正统计数据资料、分组与汇总、制定统计图和统计表
3.品质、数量
4.单项式变量数列、变量值个数
5.组限、组中值
6.等距数列、不等距数列
7.连续型变量
8.上组限不在内
9.1000、950
10.统计表、统计图
11.总标题、横行标题、纵栏标题、数值资料、主词、宾词
12.原始数据、第二手数据、审核、订正、排序
13.直方图、折线图、曲线图、圆形图
14、长方形
15、两头小,中间大、正态分布
五、简答题 (略)
六、应用能力训练题
1、

②题答案见上表
③不能编制单项数列,因为该题的变量值的个数比较多,并且变量值的变动范围比较大,不适合编制单项数列。

单项数列只适用于变量值的个数比较少,变量值的变动范围比较小的数列。

2、
4. 职工家庭基本情况调查表
5、略。

第三章统计整理

第三章统计整理
66.78% 10.33%
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分

学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .

第三章统计数据整理习题

《统计学》习题三班级学号姓名一、单项选择题:1、统计分组的关键问题是()。

A、确定分组标志和划分各组界限B、确定组距和组数C、确定组距和组中值D、确定全距和组距2、按某一标志分组的结果就表现为()。

A、组内差异性、组间同质性B、组内同质性、组间同质性C、组内同质性、组间差异性D、组内差异性、组间差异性3、用组中值代表各组内的一般水平的假定条件是()。

A、各组的次数均相等B、各组的组距均相等C、各组的变量值均相等D、各组次数在本组内呈均匀分布4、频数分布用来说明()。

A、总体单位在各组的分布情况B、各组变量值的构成情况C、各组标志值的分布情况D、各组变量值的变动程度5、在编制分配数列时,离散型变量的相邻组的组限()。

A、必须是间断的B、必须是重叠的C、既可以是间断的,也可是重叠的D、应当是相近的6、在编制分配数列时,连续型变量的相邻组的组限必须()。

A、交叉B、不等C、重叠D、间断二、多项选择题:1、统计分组的作用在于()。

A、划分现象的类型B、反映总体内部结构C、比较现象的一般水平D、分析现象的变化关系E、提示现象之间数量依存关系2、统计数据整理的内容一般有()。

A、对原始资料进行预处理B、对统计资料进行分组C、对统计资料进行汇总D、对统计资料进行分析E、编制统计表,绘制统计图3、某单位100名职工按奖金额多少分组为“300以下、300~400、400~600、600~800、800以上”这五个组。

这一分组()。

A、是等距数列B、分组标志是连续型变量C、末组组中值为800D、相邻组的组限是重叠的E、某职工奖金600元,应统计在“600~800”这一组内4、在频数分配数列中,()。

A、各组的频数之和等于100%B、各组频率大于0C、频数越小,则该组的标志值所起的作用越小D、总次数一定,频数和频率成反比E、频率表明各组标志值对总体的相对作用程度三、简答题:1、统计资料整理的步骤是什么?2、什么是分组标志?如何选择分组标志?四、实务题:1、某工业局所属30个企业工人数如下:555 506 220 735 338 420 332 369 416 548 422 547 567 288 447 484 417 731 483 560 343 312 623 798 631 621 587 294 489 445 试根据上述资料,要求:(1)编制等距及不等距的分配数列(2)根据等距数列编制向上和向下累计的频数和频率数列。

《统计学——原理与SPSS应用》第三章 统计整理

按月工资收入分组 1 000元以下 1 000—1 500 1 500—2 000 2 000—2 500 2 500—3 000 3 000元以上 合计 人数(人) 80 150 230 340 150 50 1 000 比重(%) 8 15 23 34 15 5 100
B 异距数列 按月工资收入分组 人数(人) 比重(%)
(三)编制
编制结果如下:
饮料名称 可口可乐 旭日升冰茶 百事可乐 露 露 汇源果汁 合 计 频数f 15 11 9 9 6 50
(三)编制
2、变量数列的编制
(1)单项式变量数列的编制
•编制条件:变量为离散变量,且变量的不同取 值个数较少。
【例】己知某车间有24名工人,其某日的日产量 (件)分别是:20,23,20,24,23,21,22, 25,26,20,21,21,22,22,23,22,22,24 ,25,21,22,21,24,23。 要求:根据以上资料编制变量数列。
工人按工资分组: 600 ~ 700 (
700 ~ 800
800 ~ 1200
1200 ~ 1500
连 续 变 量 )
按销售额分组 (万元) 200以下 200-400 400-800 800-1000 1000以上 商店数 (个) 25 70 130 75 40 各组商品流通费用率 (%) 11.2 10.4 9.90 6.70 5.90
通过统计分组可以看出,企业的商品销售额越大而其流通费用 率却越低,二者呈反向变动关系
体区分为若干性质不同又有联系的几个部分。
例如: 企业按经济类型分组: 国有企业 集体企业 个体企业 其它企业 学生按考分分组: 60分以下 (不及格) 60~70分 (及格) 70~80分 (中等) 80~90分 (良好)

第三章统计整理


按照习惯,成绩一般分为不及格、及格、 按照习惯,成绩一般分为不及格、及格、中 良好、 等、良好、优秀
即 组限 60分以下 60~70 70~80 80~90 90分以上 65 75 85 组中值
上组限不在内
利用Excel Excel进行分组 ㈢ 利用Excel进行分组
数据分析” 直方图 直方图” 选“工具”-“数据分析”-“直方图” 工具” 数据分析 定义“输入区域” 数据 定义“输入区域”—数据 分组中每组上限, “接收区域”—分组中每组上限,包括在本组 接收区域” 分组中每组上限 内 “输出区域”—结果 输出区域” 结果
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
复合分组
按性别 分类
对教师 的分类
共计12组 共计 组 × × 男 2×3×2
女 高级 中级 初级 青年 中年
按职称 分类 按年龄 分类
第三节 次数分布 ★ 一、分布数列的概念及种类
二、组距数列的编制 三、累计次数与累计频率
将总体各单位按分组标志分组后, 将总体各单位按分组标志分组后, 次数分布 形成的各单位在各组的分布
地位
统计整理的步骤
拟定统计整理方案 统计资料的预处理 数据处理 制作统计表或统计图
第二节 统计分组
将总体中所有单位按一定的标志划 统计分组 分为类型或性质不同的若干部分的 过程 统计分组的作用: 划分现象的类型 反映现象内部结构 分析现象之间的依存关系

统计学-第三章 统计数据整理


2020/1/10
(三)分组标志的选择(关键)
(1)分组标志:进行统计分组的标准或根据。 (2)遵循的原则(三个):
(a)符合统计研究的目的和要求; (b)必须选择最主要的、能反映总体本质特征的标志作为分组依据; (c)要考虑到社会经济现象所处的具体历史条件。
(四)统计分组的种类(两大类,五小类)
2020/1/10
引例 如何整理和显示数据?
为确定一批灯泡的使用寿命(单位:小时),质检人员在 该批灯泡中随机抽取100只进行测试,所得数据如下表3-1:
表3-1 100只灯泡使用寿命表 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688
2020/1/10
第三节 频数分布(重点)
(一)分布数列的意义
2.分布数列的两要素(名称和频数)
(1)组的名称:按一定标志划分出来的各个组。按 数量标志分组表现为各组的变量值(标志值),常 用x表示。 (2)各组次数(频数):落在各组中的总体单位个 数,绝对数。常用f表示。频率:各组频数f占总体 单位总数的比重,频数的相对数形式。反映总体的 构成,常用f/f表示。(频率分析)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档