第三章 统计资料的收集与整理

合集下载

第三章社会统计资料的整理

第三章社会统计资料的整理
表1 某班学生统计学考试成绩表
本例视研究对象本身的特点和研究的目的,按组距为10,定组数为5。按经验的看法,组数过多过少都不妥,一般情况下可分为5~7组,组数尽可能取奇数,避免偶数。
(二)等距分组和异距分组 组距数列根据组距是否相等,分为等距数列和异距数列两种。等距数列中各组组距都是相等的(如表1所示);异距数列中每组的组距是不全相等的(如表2所示)。
分配数列是统计分组的一种重要形式,它可以反映总体的结构分布状况和分布特征,这对于统计分析是很重要的。根据分组标志的不同,分配数列可分为两种:品质分配数列(简称品质数列);变量分配数列(简称变量数列)。 按品质标志分组形成为品质数列。品质数列由各组名称和次数组成。各组次数可以用绝对数表示,即频数;也可以用相对数表示,即频率。见表3-3。
由此可见,变量数列也是由各组名称(由变量值表示)和次数(或频率)组成。频率大小表明各组标志值对总体的相对作用程度,也可以表明各组标志值出现的频率大小。变量的具体数值即变量值通常用符号x表示;各组单位数即次数或频数(其相对形式即频率)通常用符号f表示。变量数列的编制,特别是其中组距数列的编制是比较复杂的,下面就组距数列的编制方法专门加以研究。
等距数列适用于标志变异比较均匀的现象,或者说,各组性质差异是由变量值均匀增加或减少而引起的。例如,学生成绩60分以上者,每增加10分就进入高一级档次。人口按身长、体重的分组等,一般均采用等距数列。
2、异距数列。异距数列各组次数的数值受组距不同的影响。在研究各组次数实际分布时,要消除组距不同的影响,这就要将不等组距的次数换算成标准组距次数。可以数列中最小组组距为标准组距,将不等组距次数换算为统一的标准组距次数,并以此绘制图形,或者是在原数列基础上先计算次数密度或频率密度,其公式为: 次数密度=各组次数/各组组距 频率密度=各组频率/各组组距 以上两种方法实质上是一样的。

第三章 统计资料整理

第三章  统计资料整理

2.分组表: 2.分组表:主词按一个标志分组的统计表. 分组表
复合表: 3. 复合表:主词按两个或两个以上标志复合 分组的统计表. 分组的统计表.
四,统计表的编制原则
应遵循科学,实用,简明,美观的原则. 应遵循科学,实用,简明,美观的原则. 统计表的各种标题要简明扼要; 1.统计表的各种标题要简明扼要; 要合理安排统计表的结构; 2.要合理安排统计表的结构; 数据计量单位相同时,可放在表的右上角标明, 3. 数据计量单位相同时 , 可放在表的右上角标明 , 不同 时应放在每个指标后或单列出一列标明; 时应放在每个指标后或单列出一列标明; 表中的上下两条横线一般用粗线,其他线用细线; 4.表中的上下两条横线一般用粗线,其他线用细线; 5.统计表的栏数较多时,通常要加以编号; 统计表的栏数较多时,通常要加以编号; 通常情况下,统计表的左右两边不封口; 6.通常情况下,统计表的左右两边不封口; 表中的数字应该填写整齐,对准位数; 7.表中的数字应该填写整齐,对准位数; 对于没有数字的表格单元,一般用" 表示; 8.对于没有数字的表格单元,一般用"—"表示; 表中主词各行和宾词各栏, 9. 表中主词各行和宾词各栏 , 应按先局部后整体的原则 排列; 排列; 10.必要时可在表的下方加上注释. 10.必要时可在表的下方加上注释.

编制
四,次数分布的主要类型 钟型分布——"两头小,中间大" 两头小,中间大" 钟型分布 两头小
对称分布
右偏分布
左偏分布
两头大, U型分布——"两头大,中间小" 型分布 两头大 中间小"
U型分布
一边小, J型分布——"一边小,一边大" 型分布 一边小 一边大"

第三章--统计整理-幻灯片(1)

第三章--统计整理-幻灯片(1)

如某班学生按年龄分组:17岁,18岁,19岁, 20岁, 21岁,22岁。
组距式分组
将作为分组依据的数量标志的整个取 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
为组的名称。
某班学生统计 学原理成绩分 组
60分以下 60—70分 70—80分 80—90分 90分以上
组距式分组中的一些概念 《统计学原理》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
复合分组体系
对教师 的分类
按性别 分类
按职称 分类
按年龄 分类
《统计学原理》第三章 统计整理
共计12组 男 2×3×2
女 高级
中级
初级 青年 中年
《统计学原理》第三章 统计整理
统计资料的再分组
• 统计资料的再分组就是把统计分 组资料按某种要求,重新划定各 组界限,再将资料中的单位数或 比重分布重新做出调整。
对总体单位而言,是“合”,即将性质相同的 个体组合起来,在同一组内则保持着相同的性 质。
分组
《统计学原理》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。

统计学第3章统计整理

统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。

月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)

统计学第三章(统计资料的整理与展示)

统计学第三章(统计资料的整理与展示)

第三章统计数据的整理与显示一、单项选择题:1.将统计总体按某一标志进行分组后,其结果是()。

A.组内同质性,组间同质性B.组内差异性,组间差异性C.组内同质性,组间差异性D.组内差异性,组间同质性2.在组距数列中,当全距确定时,组距与组数的关系是()。

A.组距越大,组数越小B.组距越大,组数越大C.组距越小,组数越小D.组距与组数的关系不确定3.连续型量在确定组限时,相邻组的组限必须()。

A.间断B.重叠C.相等D.不等4.变量数列中,各组频率的合计数应该为()。

A.大于1B.等于1C.小于1D.不等于15.在异距数列中,要准确反映其分布状况,必须采用()。

A.向上累计B.向下累计C.频数D.频率密度6.计算向上累计次数或频数时,其计数表达的意义是()。

A.上限以下的累计次数或频数B.上限以上的累计次数或频数C.下限以下的累计次数或频数D.上限以上的累计次数或频数7.在统计表中,说明统计表名称的词语是()。

A.主词B.宾词C.总标题D.横行标题8.次数分布的特征是:两头小,中间大。

即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。

这种次数分布是()。

A.正态分布B.U形分布C.正J形分布D.反J形分布9.类似于直方图,与直方图比较,其构造更容易,且能显示变量的实际值,从而不会因数据分组将具体的数值信息丢失,这种图是()。

A.折线图B.曲线图C.茎叶图D.帕拉图10.填写统计表时,当某一位置不应该有数字,应用的符号是()。

A.0B.×C.…D.–二、多项选择题:1.在统计数据整理之前,要对统计数据进行审核。

审核的主要内容是()。

A.数据的准确性B.数据的及时性C.数据的系统性D.数据的完整性E.数据的客观性2.统计分组的作用是()。

A.划分社会经济现象的类型B.刻画总体具有的特征C.揭示社会经济现象的内部构成D.反映总体单位的分布情况E.分析社会经济现象之间的依存关系3.在组距数列中,组中值是()。

统计资料整理

统计资料整理

第三章统计资料整理一、解释概念1. 统计整理是根据统计研究的目的要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。

2. 统计分组,就是根据统计研究的需要,按照一定的标志,将统计总体划分为若干个组成部分的一种统计方法。

3.分组标志就是将统计总体划分为几个性质不同部分的标准或依据。

4.复合分组是对被研究现象按两个或两个以上的标志结合起来所进行的分组。

5. 分布数列又称分配数列、次数分布,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列。

6.统计表是把统计数据按照一定的结构和顺序,用表格显示出来的一种形式。

二、填充内容1. 统计调查、统计分析。

2.逐级汇总、综合汇总。

3. 及时性、准确性。

4. 简单分组、复合分组、分组体系。

5. 并列标志、分别。

6. 离散型、组距式。

7. 反比。

8. 组中值、一般水平。

9. 重合式、非重合式。

10. 总标题、纵标目。

11. 调查表、分析表、分组表、复合表。

12. 几何图形、具体形象。

三、选择答案1.( a b c d )2.( d )3.( a )4.( b c )5.( b )6.( b )7.( d )8.( a b )9.( a )10.( a c d )11.( b )12.( c d )13.( a )14.( a c )15.( c d )四、判断改错1.(√)2.(×)分布数列包括品质数列和变量数列。

3.(√)4.(√)5.(×)是一个品质数列。

6.(√)7.(×)通常是把该数值列人下限的所在组。

8.(√)9.(×)是离散变量数列。

10.(×)开口数列是指最大值只有下限没有上限,或者是最小值只有上限没有下限。

五、简答问题1.【回答要点】①统计整理是统计工作的中间环节,是统计调查的继续,又是统计分析的基础②实现由个体到全体、由特殊到一般、由现象到本质、由感性到理性的转化,从整体上反映出事物的数量特征。

《统计学》-第三章-统计整理

《统计学》-第三章-统计整理

第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。

在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。

2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。

3、统计分组实质上是在统计总体内部进行的一种定性分类。

4、对原始资料审核的重点是真实性。

5、区分现象质的差别是统计分组的根本作用。

6、标志是统计分组的依据,是划分组别的标准。

7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。

10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。

11、按品质标志分组的结果,形成品质分布数列。

12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。

与全距的大小成正比。

14、组距变量数列的分布可以用次数分布曲线图表示。

15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。

16、统计资料的整理方法主要有统计分组和统计汇总两种。

17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。

20、统计表从内容结构上看,是由主词和宾词两部分构成。

(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。

组内同质性,组间同质性 D。

组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。

第三章统计数据的整理与显示

第三章统计数据的整理与显示

统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4. 重点调查
5. 典型调查
非全面调查
统计报表
统计报表(Statistical Report Forms) 是指依照国家统计局或国家各行政管理部 门的规定,自上而下地统一布置,以一定 的原始记录为依据,按照统一的表式,统 一的指标项目,统一的报送时间与报送程 序,自下而上地逐级定期提供基本统计资 料的一种调查方式。
3. 次数分布
统计表
统计表是把通过整理的由统计调查所 得来的原始资料,使其成为得以说明社会现 象及其发展过程的数据,并按一定顺序排列 在表格中而形成的。
1. 统计表的结构
2. 统计表的分类(分组结果)
简单表 简单分组表 复合分组表
3. 统计表设计规则(书P56 七条)
统计图
统计图是统计资料的一种表达方式,它可 以简洁直观地表示数据,可以帮助我们从众多 的数据中发现规律,可以更迅速、更有效地传 递信息,给人以明确而深刻的印象。
lg( n) K 1 lg( 2)
2. 确定各组的组距:组距(Class Width)是一个组的上限 与下限之差,可根据全部数据的最大值和最小值及 所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 3. 根据分组整理成频数分布表
等距分组表
(使用开口组)
表3-2 某车间50名工人日加工零件数分组表 按零件数分组
普查
普查(Census)是对调查对象的全 部调查单位逐一进行的调查。其特点: 是一次性调查,是专门组织的全面调查, 即普查主要用来调查属于一定时点上的 现象总量。 关键词:全面调查、一次性、时点资料
美国普查局
/
美国普查局
抽样调查
抽样调查(Sampling Survey)是 一种非全面调查,它是在全部调查单 位中抽取一部分单位作为样本进行调 查,再根据调查结果推断总体的一种 调查方法。广义的抽样调查包括随机 抽样与非随机抽样。
抽样误差是指在遵循了随机原则的条件下, 不包括登记误差和系统性误差在内的,用 样本指标代表总体指标而产生的不可避免 的误差 。
调查表
调查表一般有两种:一种是一览表,另一种是单一表。
• 单一表是每张调查表式只登记一个调查 单位的资料,常在调查项目较多时使用。 • 它的优点是便于分组整理,缺点是每张 表都注有调查地点、时间及其他共同事 项,造成人力、物力和时间的耗费较大。 一览表是一张调查表式可登记多个单位的 调查资料。
105~109 110~114 115~119 120~124 125~129 130~134 135~139
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
等距分组表
(一般情况:上组限不在内)
表3-3 某车间50名工人日加工零件数分组表 按零件数分组
服务广告 25.5%
图3-4
商品广告 56.0%
某城市居民关注不同类型广告的人数构成
甲乙两城市家庭对住房状况的评价 (环形图)
13% 10% 15% 21% 7% 8%
非常不满意 36%
33% 不满意 一般
31%
满意
非常满意
26% 图3-5 甲乙两城市家庭对住房状况的评价
散点图
人均GDP 8000 7000 6000 5000 4000 3000 2000 1000 0 1985 1990 1995 2000 2005 人均GDP
122 118 118 127 124
125 108 112 135 121
分组方法
• 分组方法
单变量值分组
组距分组
等距分组
异距分组
单变量值分组
(要点)
• 1. 将一个变量值作为一组 • 2. 适合于离散变量 • 3. 适合于变量值较少的情况

单变量值分组表
(实例)
表3-1
零件数 (个 )
105~110 110~115 115~119 120~125 125~130 130~135 135以上
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
茎叶图
(茎叶图的制作)
1. 2.
用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组 成的 以该组数据的高位数值作树茎,低位数字作树叶 对于n(20≤n≤300)个数据,茎叶图最大行数不超过 L = [ 10 × log 10 n ] 5. 茎叶图类似于横置的直方图,但又有区别
关键词:典型单位,是指那些能充分、集中地 体现调查对象总体某些方面共性特征的最有代 表性的单位。
资料审定
调查资料的审定目的,就是要 保证资料的准确性,尽可能地缩小 调查误差。即对对调查资料的准确 性、完整性和及时性进行检查 。
统计分组是根据统计研究的目的,选择某 一标志作为分组的依据,将总体分成若干个不 同的组。经统计分组后,各组组内的个体的性 质是相同的,不同组的个体的性质是不同的。
举例1:绘制直方图、散点图、折线图 举例2:绘制条形图、饼图、环形图
举例3: 茎叶图
原始资料
原始资料也称为第一手资料, 是反映被调查对象原始状况的资料。 如原始记录、统计台帐、调查问卷 答案、实验结果等。
举例:数据集03、数据集04
次级资料
次级资料也称为第二手资料, 是已经存在的经他人整理分析过 的资料。如期刊、报纸、广播、 电视以及因特网上的资料,各级 政府机构公布的资料,企业内部 记录和报告等。
128 129 130 131 133 134 135 137 139
频数 (人 )
2 1 1 1 2 2 1 1 2
组距分组
(要点)
1. 2. 3. 4. 5. 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 必须遵循“不重不漏”的原则 可采用等距分组,也可采用不 等距分组
~ ~ ~ ~ ~

3. 4.
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息

茎叶图
(茎叶图的制作)
树茎 树叶 数据个数
3
10 788
11 022347778889
12 0012222333344466777889 13 0133445799


117 108 110 112 137
122 131 118 134 114
124 125 123 127 120
129 117 126 123 128
139 122 133 119 124
107 133 134 113 115
117 126 127 120 139
130 122 123 123 128
数据中华
统计调查方案
调查必然产生误差
调查时都会使用调查表
统计误差
登记误差是由于调查过程中各有关环节工作的失 误而造成的。
代表性误差是由于非全面调查只观察总体一部分 单位,这部分单位不能完全反映总体的性质而产 生的误差。 (系统误差 抽样误差)
• 不遵循随机原则,有意识多选好的单位或 较差的单位进行调查而造成的系统性误差 。
107 108 110 112 113 114 115 117 118
某车间50名工人日加工零件数分组表
频数 (人 )
1 2 1 2 1 1 1 3 3
零件数 (个 )
119 120 121 122 123 124 125 126 127
频数 (人 )
1 2 1 4 4 3 2 2 3
零件数 (个 )
组距分组
(几个概念)


1. 2. 3. 4.
下 限:一个组的最小值 上 限:一个组的最大值 组 距:上限与下限之差 组中值:下限与上限之间的中点值
组中值=
下限值+上限值
2
组距分组
(步骤)
1.
确定组数:组数的确定应以能够显示数据的分布特 征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K
链接
(1)统计调查方案 (2)统计调查方法
(3)统计调查的组织方式
统计资料的整理
统计资料的整理,是根据统计研究的目 的,对所收集到的大量、零星分散的原始资料 进行科学加工与综合,使之系统化、条理化、 科学化,为统计分析提供反映事物总体综合特 征资料的工作过程。
1. 统计资料的审定
2. 统计资料的分组
它的优点是当调查项目不多时,应用一览 表能使人一目了然,还可将调查表中各有 关单位的资料相互核对,其缺点是对每个 调查单位不能登记更多的项目。
统计调查方 法 1. 现场观察法 2. 报告法 3. 问卷法
4. 访谈法 5. 实验采集法
统计调查 1. 统计报表 组织方式
2. 普查 3. 抽样调查
全面调查
•简单随机抽样:随机性原则 •分层抽样:将总体按标志分为若干个类型组。
•系统抽样:又叫等距抽样或机械抽样。将总体 按某一标志排队,每隔相等的间隔和距离抽样。
• 整群抽样:将总体划分为若干个群(组), 然后以群(组)为单位从中抽取部分群 (组)。对抽中的群(组)进行全面调查。
重点调查
重点调查(Key-point Survey)是指在 调查对象中,选择一部分重点调查单位收 集统计资料的一种非全面调查。
条形图
(由 Excel 绘制的条形图)
其他广告 2 招生招聘广告
10
广 房地产广告 告 金融广告 类 型 服务广告
商品广告
16 9
51 112
0
40
80
人数(人) 120
相关文档
最新文档