第二章 统计数据的收集整理与显示6
统计学第2章 统计数据的搜集、整理和显示

第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
第2章数据的搜集、整理和显示分析

5.类别项目重叠。如:你喜欢下列哪种媒体?书本()
VCD() CAI课件() 光盘() 指导书() 其他()
▪ 6.在回答者能懂的范围内提问。如:你认为大学应加
强学习支持服务系统建设吗?(基层的老师、学生不一定 知道“学习支持服务系统”的概念)
• 2.非全面调查
非全面调查可分为抽样调查、重点调查和典型调查。
• (1)抽样调查。抽样调查是按随机原则从调查对象中抽取一 部分单位作为样本进行观察,然后根据所获得的样本数据, 对调查对象总体特征做出具有一定可靠程度的推算。
• 抽样调查有如下几个特点:第一,按随机原则抽取的。第二, 可以对调查对象总体的数量特征做出估计。第三,抽样误差 可以事先计算并加以控制。
• A.普查 B.重点调查 C.典型调查 D.抽样调查
问卷设计
• 一、问卷的内容:
• 1、问卷的编码;
• 2、研究目的、指导语、填表说明;
• 3、指标解释、调查须知及其他事项说明等;
(如涉及需为被调查者保密的内容,必须指明予以保密, 以消除被调查者的顾虑)
• 4、问卷题目;
• 5、调查问卷的最后注明调查员的姓名、访问 日期、访问时间等。
• 2.下列调查中属于非全面调查的有 (多选)
• A.普查 B.重点调查 C.典型调查 D.抽样调查 E.全面统计报表
• 3.调查大庆、胜利、大港等几大油田,以 了解我国石油生产的基本情况,这种调 查属于( )
• A.普查 B.重点调查 C.典型调查 D.抽样调查
• 4.要了解我国农村经济的具体情况,最适 合的调查方式是( )
(三)定期报表形式与专门调查
统计调查按组织形式可分为定期报表形式和专门调查。专 门调查是为某一专题研究而组织的专项调查,一般地,普 查、抽样调查和典型调查等可以是专门调查。
统计学 第二章 统计数据的搜集、整理和显示

登记法
是指当事人根据有关法制法规 规定,在开展某些活动或发生 某事时,主动到有关机构进行 登记,填写有关表格,提供有 关统计信息。
五、问卷设计
(一)问卷的概念与结构
问卷是依据统计研究目的和要求,按照一定的理论假设 设计出来的、由一系列问题、项目、备选答案及说明所组成 的、向被调查者收集资料的一种工具。
即填表须知、交表时间、地点及其他事项说 明。
问卷编号
问卷的基本结构
❖被调查者基本情况
通常放在问卷的最后,主要是有关被调查者的一些 背景资料,该部分所包含的各项问题,可使研究者根 据背景资料对被调查者进行分类比较分析。
❖问题和答案
该部分是调查问卷的核心,包括了所要调 查的全部问题,以及这些问题的所有可供选择 的答案。
和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。
• 商检人员在某超市检查出售的饮料的合格率。
• 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
询问法可分为:
面谈调查法
是指调查人员同被调查者面对面 交谈,当面听取意见,询问有关
问题,搜集数据的方法。
电话调查法
指调查人员利用电话同受访者进 行语言交流,从而获得信息的一
种调查方式。
邮寄调查法
是一种标准化调查,指调查者将印制好的 调查问卷或调查表格,通过邮政系统寄给 选定的被调查者,由被调查者按要求填写 后,按约定的时间寄回的一种调查方法。
第二章统计资料的收集、整理与显示

第二章统计资料的收集、整理与显示第一节统计数据的收集一、统计数据收集的含义和要求统计数据收集是整个统计活动的基础阶段,通常也称为统计调查阶段。
统计数据收集的基本要求是准确性、及时性和完整性。
二、统计数据收集方案设计统计数据收集方案应包括以下一些内容:数据收集目的、数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、数据所属时间和数据收集期限、数据收集地点和数据收集的组织。
三、统计数据收集方式有两种:统计调查方式和实验方式。
(一)统计调查方式统计调查就是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观对象搜集资料的过程。
1、普查概念:根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料。
组织方式:a)专门组织普查机构调查;b)利用现有统计资料;基本原则:a)标准时点(避免重复和遗漏)b)调查步骤(同一次调查在不同阶段)统一性原则c)指标口径(内涵)d)调查时间(起止)e)普查周期:我国为期十年的普查制度2、抽样调查抽样调查可分为概率抽样和非概率抽样两类。
(1)概率抽样a)概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来。
b)特点:在样本的抽取上遵循随机原则在调查的功能上能以部分推断总体在推断的手段上运用概率估计的方法在推断的理论上,以大数定律和中心极限定理为依据在推断的效果上,抽样误差可以计算并加以控制c)概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。
重复抽样的特点是:总体的每个个体都有数次被抽中的可能性,次抽样之间相互独立。
不重复抽样的特点是:总体中每个个体都只有一次被抽中的可能性,次抽样之间不相互独立d)概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。
简单随机抽样是抽样调查最基本的组织形式,具体的样本抽取方式有抽签法和随机数表法等;分层抽样特点是必须具备总体所有个体的名录和至少一个分层标志的全面资料,各层的抽样相互独立,尽量把总体差异通过分层而转化为层间差异;等距抽样的特点依固定的间隔和规定的顺序来抽取个体,属于不重复抽样;整群抽样要尽量把总体差异转化为群内差异等,一般属于不重复抽样;多阶段抽样特点是整群抽样和分层抽样两种组织形式的综合。
第2章 统计数据的搜集、整理与显示

1)单项式分组与组距式分组
A)单项式分组:用一个变量值作为一组,形成单项 式变量数列。 变量值又称标志值。按数量标志分组,数量标志的 表现,就是变量的取值 单项式分组一般适用于离散型变量且变量变动范围 不大的场合。 B)组距式分组:将变量依次划分为几段区间,一段 区间表现为“从……到……”距离,把一段区间内的 所有变量值归为一组,形成组距式变量数列。区间 的距离就是组距。 连续型变量或者变动范围较大的离散型变量,适宜 采用组距式分组。
1、向上累计频数(或频率)分布:先列出各 组的上限,然后由标志值低的组向标志值高 的组依次累计。向上累计频数表明某组上限 以下的各组单位数之和是多少,向上累计频 率表明某组上限以下的各组单位数之和占总 体单位数比重的大小。 2、向下累计频数(或频率)分布:先列出各 组的下限,然后由标志值高的组向标志值低 的组依次累计。向下累计频数表明某组下限 以上的各组单位数之和是多少,向下累计频 率表明某组下限以上的各组单位数之和占总 体单位数比重的大小。
16
二、统计分组
(一)统计分组的概念与种类 根据统计研究的目的和客观现象的内在特点,按某 个标志(或几个标志)把被研究的总体划分为若干 个不同性质的组,称为统计分组。
分组的性质:兼有分和合双重含义。 穷尽原则,使总体中的每一个单位都应有组可归,或者说 各分组的空间足以容纳总体所有的单位。 互斥原则,在特定的分组标志下,总体中的任何一个单位 的只能归属于某一组,而不能同时或可能归属于几个组。
特点:可以了解较详细的情况,但无法对现象总体的数量特
征作出准确的推算,也无法测算调查误差。
适用场合 :当调查任务只要求掌握基本情况,而部分单位
统计资料的搜集、整理和显示

第二章 统计资料的搜集、整理和显示
2、确定调查对象与调查单位(Who) (1)调查对象:调查研究的总体。 [例]人口普查:具有中国国籍并在中国境内常住的自然人; 农村生育率调查:农村15~49岁的女性人口。 (2)调查单位:调查研究的总体单位(个体),调查内容的承担者。 (3)填报单位:填写、上报统计资料的单位。
第二章 统计资料的搜集、整理和显示
3、确定调查项目和调查表(问卷)(What) (1)调查项目:调查单位所承担的基本标志。 (2)调查表 单一表:一个调查单位用一张表; 一览表:多个调查单位共一张表。 (3)调查问卷 4、确定调查时间(When) (1)调查时间:资料所属时间。 (2)调查期限:调查工作的起止时间。
1、总标题:时间、空间、总体、指标;
按地区分组
完成投资额(亿元)
增长率(%)
比重(%)
甲
(1)
(2)
(3)
东部地区 中部地区 西部地区
12,188 4,121 2,387
17、5 20、7 21、1
65、2 22、0 12、8
2000年A国工业企业固定资产投资情况 总标题
第二章 统计资料的搜集、整理和显示
STAT
01
02
统计分组 频数分布
本章难点
统计数据采集的方式方法; 统计数据的整理; 统计数据的显示。
本章重点
第二章 统计资料的搜集、整理和显示
第一节 统计数据的搜集 一、概念 (一)定义:具体搜集统计资料的工作过程。 (二)数据的种类 1、调查数据 2、实验数据 (三)统计调查方案的设计 1、明确调查目的(Why) [例]人口普查:准确查清人口的数量、地区分布、构成和素质状况及其变化情况。
第统计分组种类 1、按分组标志的性质不同 (1)品质分组 (2)数量分组 2、按分组标志的多少分类 (1)简单分组:只按一个标志分组 (2)复合分组:按两个或两个以上的标志层叠起来进行分组。 [例]对人口按性别、文化程度进行复合分组。
统计数据的收集整理与显优秀课件

统计数据的收集整理与显优秀
分布在各组中的个体单位数叫做次数或 频数。
各组次数与总次数之比叫做比率或频率 。
将各组别与次数按一定的次序排列所形 成的数列称作次数分布数列,简称分布数列 ,又称分配数列或频数分配。
统计数据的收集整理与显优秀
白领 高中 68
4 17 否
蓝领 小学 72
3 24 是
白领 大学 99
3 33 是
统计数据的收集整理与显优秀
依照各居民户职业类别和文化程度的 具体标志表现对居民户总体进行分组
统计数据的收集整理与显优秀
居民户总体按职业类别分组
按职业类 纳入组内户 别分组 的门牌号
白 领 1、2、5、7
蓝 领 3、4、6
统计数据的收集整理与显优秀
2.意义 统计整理是统计工作过程的第三阶段 ,是统计调查的继续,是统计分析的前提,它 是从对现象的感性认识过渡到对现象理性 认识的开始,是这个过程的连续点,并为 这个过程提供坚实的基础,它在统计工作 中起着承前启后的作用 。
统计数据的收集整理与显优秀
3.统计整理的内容与程序
5
5/7=71.43 %
设计并计算统计指标
完
整
的
分
组
表
统计数据的收集整理与显优秀
数量标志分组
A.单项式分组设计
用单一的数值作为组的名称,这样的分 组设计称为单项式分组设计。单项式分组 设计适用于离散型分组标志或经过离散化 处理的连续型分组标志。
统计数据的收集整理与显优秀
40
【例1】己知某车间有24名工人,他们的日产
统计数据的收集整理与显优秀
统计学 2统计数据收集整理和显示

2019/10/31
25
6.网络调查法
网络调查(又称网上调查)是指利用国际互联网 作为技术载体和信息交换平台进行调查的数据搜 集方法。
其业务流程大体包括方案设计、问卷上网、问卷 检查、数据处理与分析、调查报告等。
2019/10/31
2
根据经济普查资料,我国对2019年GDP进行了重新核 算,2019年我国GDP现价总量为159878亿元,比快报核 算数增加了23002亿元,增幅16.8%。同时,对1993年 以来的GDP历史数据进行了修订。
2019/10/31
3
2.1 统计数据的来源
2.1.1 次级统计数据的来源
2) 统计报表调查事先已作为一种制度布置到 基层报告单位,要求各单位根据原始记录和统 计台账提供报表所需的资料,从而保证了资料 来源的可靠性和准确性;
3) 由于统计报表调查是逐级整理上报,统计 资料可以使各级地方政府和部门及时了解和掌 握本地区、本部门的基本情况。
2019/10/31
17
(3)统计报表调查的局限性
的表格形式、统一的指标、统一的报送 程序和报送时间,自下而上逐级提供基 本统计资料的一种调查组织形式。
我国现行的统计报表, 包括国民经济基本统计 报表和专业统计报表。
2019/10/31
16
(2)统计报表调查的优点
1) 在报表实施范围内,各报告单位按期报送, 可保证调查资料的全面性、连续性和及时性;
实验法一般包括提出研究假设、进行实验设计、 选择实验对象、控制实验环境和收集实验数据 等步骤。
实验法具有方法科学、反映客观、过程容易控 制等优点,但也有时间长、费用高、实验对象 选择的难度大等不足。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.4.3 频率分布
累计分布有向上累计分布与向下累计分布两种。 向上累计分布是将各组的频数或频率由变量值小的组向变 量值大的组累计,累计结果分别说明各组上限以下的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。 向下累计分布是将各组的频数或频率由变量值大的组向变 量值小的组累计,累计结果分别说明各组下限以上的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。
表2-4 某年年底某高校在职教师年龄累计分布数列
比重 教师按年 人数 龄分组 (人) (%) 向上累计 向下累计
频数(人)频率(%) 频数(人)频率(%)
30岁以下 30~40岁 40~50岁 50~60岁 60岁以上
合计
201 317 366 151 15
1050
19.14 30.19 34.86 14.38 1.43
100.00
201 518 884 1035 1050
—
19.14 49.33 84.19 98.57 100.00
—
1050 849 532 166 15
—
100.00 80.86 50.67 15.81 1.43
—
2.3
数据的显示
2.3.1 统计表 2.3.2 统计图
统计表
将统计数据按一定的顺序排列在表格上,就形成了 统计表。从广义讲,统计表包括统计工作各阶段所使用 的一切表格,有调查表、汇总表和分析表。本章将侧重 就表现统计整理结果所用的统计表进行讨论。 统计表的构成 1.从统计表的形式上看,可由总标题、横行标题、 纵栏标题和指标数值四部分组成。 此外有些统计表在 表下还增列补充资料、注解、附记、资料来源、某些指 标的计算方法、填表单位、填表人员以及填表日期等。
组距式变量数列又可分为:等距式数列与不等距式数列;开 口式数列与封闭式数列等
年龄 (岁) 0-10 10-20 20-30 30-40 40-50 50-60 合计
人数 比重(%) f/∑f f 3 5 4 4 2 2 20 等距数列 15 25 20 20 10 10 100
年龄 (岁) 0-10 10-30 30-50 50-60 合计
2.2.4.3 频率分布
1.频率分布的性质
按顺序列出各组的组别及相应的频率,就构成频率分布。 频率分布可以比频数分布更好地体现出总体分布特征。频率 分布有两个基本性质:一是各组频率都是一个介于0与1之间 的分数,即大于0而小于1;二是各组频率之和等于1。
2.累计频率分布
在频数分布的基础上,将各组频数依次累计,就形成 累计频数分布。各组累计频数与总频数之比,就形成累计频 率分布。
例如:
3)组中值的计算
3)组中值的计算
在编制组距数列时,为了避免出现空白组,同时又能使个别 变量离差较大的单位不致于无组可归,往往在首末两组使用 “××以下”及“××以上”的不确定组限的形式。这种形 式叫做“开口组”。
为进行统计分析,有时也要假定开口组的组限,并计算 其组中值。
一般可按相邻组的组距来计算“开口组”的假定的组限.然 后再计算组中值。计算式为,
统计表的构成
表2-5 2005年我国三次产业增加值及增长情况表 总标题 比2004年增长
异距数列
不连续组距数列
2.2.4.3变量数列的编制
1.单项数列的编制 2.组距数列的编制
根据总体各单位的变量值进行同类合 并,并列出相应的单位数或比重。
1)确定变量数列的形式——根据变量的性质及特点选择不同的变量数列。
2) 确定组距和组数 —— 注意几个概念:上限、下限、组距、组数。
组数过多,组距太小,要避免将相同性质的单位分到不同组中去; 反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一 组中去。 3) 确定组限 ——(1 )客观数量界限。(2 )第一组的下限和最后一组 的上限。有极端值时,第一组和最后一组可采用开口组。(3)尽可能 采用5或10的倍数。 “上限不在内原则” 4) 确定分配次数 —— 可利用EXCEL表进行汇总。
人数 比重(%) f/∑f f 3 15 9 45 6 30 2 10 20 100
异距数列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列 等距数列 组距数列 连续组距数列
男生
文科
本科
女生 男生 女生 男生
专科
理科
本科
女生
男生
专科
女生
3.按品质标志分组
按品质标志分组,就是选择反映事物属性差异的品 质标志作为分组标志,并在品质标志的变异范围内 划定各组界限,将总体划分成为若干个性质不同的 组成部分。
例如:人口总体按性别,分为男、女两组; 再如:企业总体按所有制,分为全民、集体、合 营、个体等组。
统计年鉴中按年 龄分组为:
0-14 15-64
少年 中青年
65岁以上 老年
2)组限的确定
当组距、组数确定后,只需划定各组数量界限便可 编制组距数列。
3)组中值的计算
组距数列掩盖了分布在组内各单位的实际变量值。 为了反映各组中个体单位变量值的一般水平,统计 工作中往往用组中值来代表它。 组中值是组内变量范围的中间数值,通常可根据备 组的上限、下限进行简单平均,即: 组中值=(上限+下限)/2
对总体只按一个标志进行分组,称为简单分组。 如:以产值作为划分企业规模的标志;按文化程 度对人口总体进行分组。
统计对总体往往要从多方面进行研究,仅仅依赖 一个分组标志进行分组是难以满足需要的,必须 运用多个分组标志进行多种分组,形成一个分组 体系,才能满足需要。
2.复合分组
对同一总体选择两个或两个以上的标志层叠进行分 组,就形成复合分组。 例如,为了认识我国高等院校在校学生的基本状况, 可以同时选择学科、学制、性别等三个标志进行复 合分组,得到如下分组体系。
如用相对数形式表示便是比率。比率是一种结构相 对数,各组比率之和应等于1或100%。
各组次数或比率的大小意味着相应的变量值在决定 总体数量表现中所起的作用不同。次数或比率大的 组,其变量值在决定总体数量表现中的作用就大, 反之就小。 由于社会经济现象性质的不同,各种统计总 体都有不同的次数分布,形成各种不同类型的分布 特征。
首组假定下限=首组上限-邻组组距………………(4)
组中值=上限-邻组组距/2
末组假定上限=末组下限+邻组组距………………(5) 组中值=下限+邻组组距/2
按成绩分组X组中值 Nhomakorabea60分以下 60-70分 70-80分 80-90分
90分以上
55
65 75
85
95
4)分布数列的次数
次数是分布在各组中的个体单位数。
10~15年 15~20年 20年以上 数量标志分组
统计分组的作用
1 、提示类型:统计分组的根本作用是将复杂的社会经济现象 按照统计认识的要求区分为各个性质不同的组成部分。 2.说明总体现象的内部结构。现象的内部结构是表明现象本 质特点的一个重要方面,将同一总体不同时期的结构联系起来, 还可以看到现象的发展趋势和规律。 3、反映变化。将总体的分组资料按时间的移动联系起来进行分 析,可以反映总体及各组在数量上的变动情况和变动规律。 4、分析总体现象之间的依存关系。通过分组将有相互影响的现 象联系起来进行研究,反映它们在数量上的变动规律。例如:商 品销售额与流通费用率的关系;居民收入与储蓄额的关系。
品质数 列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列
组距数列
某组人群20个人年龄如下(单位:岁):
1,5,12,15,21,12,15,21,21,22,30,33,15,30,5,48,49,
4.按数量标志分组
按数量标志分组,就是选择反映事物数量差异的数 量标志为分组标志,并在数量标志的变异范围内划 定各组界限,将总体划分为性质不同的若干组成部 分。 例如,居民家庭按子女数分组,可分为0人 (无子女)、1人、2人、3人;等等。
例 1 为了了解某地区银行存款的构成,可以选用 存款性质、期限两个标志分别进行分组: 按存款性质分组 存款同时按其性质及期限分组 企业存款 企业存款 简单 储蓄存款 分组 活期 财政性存款 定期 按存款期限分组 品 储蓄存款 质 活期存款 活期 复合 标 定期存款 志 分组 定期 分 财政性存款 组 例2 企业职工按工龄分组: 活期 5年以下 定期 5~10年
1)确定组距和组数
单项数列不存在组距的问题
编制组距数列时,不仅要考虑各组的划分是否能区分总体内 各组成部分的性质差别,还需要确定适当的组距和组数,才 能准确而清晰地反映总体的分布特征。 在实际进行分组时,采用等距数列或异距数列,应决定于现 象的性质和研究的目的。标志值分布比较均匀时,一般用等 距数据;标志值分布很不均匀时,应采用异距数列 。
本科课程陈宜治系列课件
统计学
课件制作:陈宜治
2.2.3
统计分组
统计分组的含义 统计分组的种类
统计分组的 概念和原则
25%
33% 42%
概念 原则
根据统计研究的目的和客观现象的内在特点, 按某个标志(或几个标志)把被研究对象的总体 划分为若干个不同性质的组。
穷尽原则、互斥原则
文盲或识字不多 小学毕业 中学毕业(含中专) 大专毕业 大学及大学以上
例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业