统计数据的收集、整理与显
统计学:统计数据的收集、整理与显示习题与答案

一、单选题1、抽样调查中,抽取样本必须遵循什么原则。
()A.随机原则B.随意原则C.对等原则D.可比原则正确答案:A解析:随机抽样也叫概率抽样,即总体中的个体有一个事先已知的概率被抽中。
2、某市工商企业2017年生产经营成果的年报呈报时间规定在2018年1月31日,则调查期限为()。
A.一个月B.一年C.一日D.一年零一个月正确答案:A解析:调查期限:调查工作进行的起迄时间。
3、次数分布的类型主要取决于()。
A.变量是连续还是离散B.统计总体所处的条件C.社会经济现象的性质D.分组标志的选择正确答案:C解析:社会经济现象的性质决定了社会经济现象呈现何种分布。
4、以下有关典型调查的表述不正确的是()。
A.必须同其他调查结果结合起来使用B.不容易受人们主观认识上的影响C.可以检验全面调查数据的真实性D.能够补充全面调查资料的不足正确答案:B5、重点调查中重点单位是指()。
A.标志总量在总体中有很大比重的单位B.具有反映事物属性差异的品质标志的单位C.能用以推算总体标志总量的单位D.具有典型意义或代表性的单位正确答案:A二、多选题1、采用类型抽样的组织形式是()。
A.最符合随机原则B.需要对总体各单位进行分组C.适用于总体各单位标志值差异较大的总体D.组内是进行全面调查正确答案:B、C解析:类型抽样是将总体全部单位按有关标志分成若干层,然后按照随机原则从每层中分别抽取样本单位组成样本,适合于差异大的总体,能使样本结构更接近于总体结构,提高样本的代表性。
2、在组距数列中,组中值是()。
A.在开放式分组中,可参照相邻组的组距来确定B.上限和下限之间的中点数值C.在开放式分组中无法确定D.就是组平均数正确答案:A、B解析:组中值是下限与上限之间的中点值,是在假定各组内均匀分布时的一个近似值。
闭口组的组中值是上限与下限的简单算术平均数;开口组组中值的确定,一般以其相邻组的组距的来调整3、对于离散型变量数列()。
统计的四个过程

统计的四个过程
统计是通过收集、整理、分析和解释数据来描述和推断总体特征的一门科学。
统计的四个过程如下:
1. 数据收集:这是统计过程的第一步,需要明确研究问题,并选择合适的数据收集方法。
数据可以通过调查、观察、实验等方式获得。
在收集数据时,需要注意数据的准确性、完整性和可靠性。
2. 数据整理:收集到的数据可能是杂乱无章的,需要进行整理和分类,以便于分析。
这包括对数据进行编码、分类、排序、筛选等操作,以及检查和清理数据中的错误和缺失值。
3. 数据分析:在这个阶段,使用适当的统计方法和工具对数据进行分析。
目的是提取有用的信息、发现数据中的模式和关系,并评估变量之间的相关性和差异性。
常见的统计分析方法包括描述性统计、假设检验、方差分析、回归分析等。
4. 数据解释:最后一步是对分析结果进行解释和推断。
根据数据分析的结果,得出结论,并将其与研究问题和背景相结合。
这可能涉及到对结果的实际意义、统计显著性、置信区间等进行解释和评估。
这四个过程是相互关联、相互依赖的。
数据收集是基础,数据整理为分析做好准备,数据分析是核心,而数据解释则是将结果转化为有用的信息和结论。
统计过程的目标是从数据中提取有用的信息,并提供可靠的结论和推断。
通过遵循这四个过程,统计学家能够更好地理解数据、解决问题,并为决策提供依据。
统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示

– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
4 第二章 统计数据的搜集、整理和显示

• 最后一组的累计频率等于1。
9
(五)累计频数(频率)分布图
• 做法 – 以分组变量为横轴,以累计频数(频率)为纵 轴而做出的图形。 • 分类 – 向上累计频数(频率)分布图; – 向下累计频数(频率)分布图。
10
向上累计频数(频率)分布图
– 在直角坐标点系上将各组组距的上限与其相应的累 计频数(频率)所构成的坐标点,依次用直线(或 光滑曲线)相连,形成向上累计曲线。
(二)统计表的分类
• 1、按用途分类
– 调查表
– 整理表或汇总表
– 分析表
• 2、按照主词的结构分类
25
– 简单表
•主词未经任何分组的统计表称为简单表。主
词罗列各单位的名称。
表 4-6
项目 工业增加值 年底人口数 固定资产投资 全社会消费品零售额 全国出口商品总额 全国进口商品总额
2005 年我国主要宏观经济指标
注意开口组下限的确定:第一、根据开口组组距等于相邻组距确定开口组的下限; 第二、根据原始资料分组后,如果按照以上方法确定下限后 ,有数据比下限小,则最小值为开口组的下限
7
(三)累计频数分布特点
• 第一组的累计频数等于第一组本身的频数;
• 最后一组累计频数等于总体单位数。
8
(四)累计频率的两个特点
图 4-2 向下累计图
50
1.0 0.8 0.6 0.4 0.2
累 计 频 数 ( 居 民 户 数 )
40 30 20 10
累 计 频 率
)
800
1040 1280 1520 居民户月消费支出 00 000
12
四、洛仑兹曲线
• 含义
统计学统计数据的整理和显示

组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容
肆
叁
贰
壹
统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。
第三章统计数据的整理与显示

统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
统计数据的整理和显(1)

分组的原则:穷尽和互斥
1.按品质标志分组或按数量标志分组,或用两 种标志结合分组 2.按主要标志与辅助标志分组
(四)统计分组体系
1.简单分组与平行分组
标 按性别分组
志 男性 女性
(二)统计分组的作用
1.划分性质不同的各种类型,研究其特征和规律性
表1 我国近几年农业总产值情况 单位:亿元
类型 1995年 1996年 1997年 1998年
农业 11884.6 13539.8 13866.9 14099.3
林业
709.9
778 817.8 848.7
牧业
6044.9 7083 7620.3 7729.8
如:某校按学生人数分组,其组限为: 100人以下 101—200 201—300 301人以上
组距分组中,上述分组都是等距分组,即各组组 距相等,其特点是:
由于各组组距相等,各组次数的分布不受组距大 小的影响,它消除了组距对其分布的影响,与次数 密度的分布是一致的,一般呈正态分布。
同时也存在不等距分组即只要有一组组距不相等的 分组,也称异距分组。例如学生年龄18岁以下,1920,21-24,25岁以上等。其特点是:
60—70
—60
70以上等
61人以上等
我们把这种分组形式称为开口组。“以下”称之 为下开口,“以上”称之为上开口。
下开口的组中值=本组上限-(1/2)*相邻组 的组距
上开口的组中值=本组下限+(1/2)*相邻组 的组距
例如结合上面学生成绩的分布计算其组中值 下开口组中值=60-(1/2)×(70-60)=55 上开口组中值=70+(1/2)×(70-60)=75
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/10/8
版权所有 BY 统计学课程组
4
第一节 统计数据的收集
一、间接数据的来源
二、直接数据的来源
2020/10/8
版权所有 BY 统计学课程组
5
一、间接数据的来源
间接数据主要是从公开渠道获得 的数据,如公开出版的报纸、书籍 及相关网站中的数据,有些未公开 的数据在获得数据所有者允许的情 况下也可以使用。
2020/10/8
版权所有 BY 统计学课程组
13
(一) 统计调查方式(3)
普查的特点: (1) 普查通常是周期性的。全国经济普查每10年进行两
次,分别在逢3、逢8的年份实施。全国人口普查在每逢 年数尾数为0的年份进行。 (2) 普查一般需要规定统一的标准时间,避免调查数据 的重复与遗漏,保证调查结果的准确性。 (3) 普查比任何其他调查方式、方法所取得的资料更全 面、更系统。 (4) 普查涉及面广、工作量大、时间较长,而且需要大 量的人力和物力、组织工作较为繁重,因此普查的适用范 围比较窄,只能调查一些最基本的特定现象。
2020/10/8
版权所有 BY 统计学课程组
10
二、直接数据的来源
直接统计数据的来源渠道主要有两 个:一是专门组织的调查;
二是科学试验。
前者是社会经济数据的主要来源, 后者是自然科学数据的主要来源。本 书着重讨论取得社会经济数据的方式 和方法。
2020/10/8
版权所有 BY 统计学课程组
11
2020/10/8
版权所有 BY 统计学课程组
9
选择间接数据时应该注意的问题:
(1)应根据研究目的选择间接数据; (2)注意间接数据变量名称的含义是否发生过变化。随
着历史的变迁,有些间接数据变量名称的内涵或外延发生 了变化,在采用数据时应该进行调整; (3)注意间接数据的计算口径和计算方法是否一致; (4)注意尊重间接数据所有者的权益。一是要合法采用 次级数据;二是要注明数据的来源出处,这样既尊重他人 的劳动成果,又便于阅读者核实。
2020/10/8
版权所有 BY 统计学课程组国家、地区和行业或部门的年鉴。例
如,《中国统计年鉴》、《中国统计摘要》、《中国经济年鉴》、《中国农
村统计年鉴》、《中国城市统计年鉴》、《中国社会统计年鉴》、《中国人
口统计年鉴》、《中国劳动统计年鉴》、《中国工业经济统计年鉴》、《中
第二章
统计数据的收集、整理与显示
第一节 统计数据的收集 第二节 调查设计 第三节 统计数据整理 第四节 统计表的设计
2020/10/8
版权所有 BY 统计学课程组
1
本章重点与难点
重点: 掌握调查设计和数据整理的方法;
正确使用统计图、表来展示数据的特 征。 难点: 调查问卷的设计。
2020/10/8
(一) 统计调查方式(1)
常用的统计调查方式主要有普查、统计报表调查和抽样调查等。我国
《统计法》第十条第一款规定:“统计调查应当以周期性普查为基础,以
经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补
充,搜集、整理基本统计资料” 。这是法律从总体上对我国统计调查方
法所作的基本规范,明确了我国应当建立科学统计调查方法体系的总框架。
2020/10/8
版权所有 BY 统计学课程组
2020/10/8
版权所有 BY 统计学课程组
14
(一) 统计调查方式(4)
2.统计报表调查(statistical report forms)
定义2.2 按照国家有关法规规定, 自上而下地统一布置、自下而上地 逐级提供基本统计数据的统计调查 方法,称为统计报表调查。
我国现行的统计报表,包括国 民经济基本统计报表和专业统计报 表。
国财政年鉴》、《中国金融年鉴》以及全国各省、市、自治区、直辖市、新
疆生产建设兵团的统计年鉴等。
2020/10/8
版权所有 BY 统计学课程组
7
对于某些特定行业的数据,如证券业数据,我们可以 从各证券报、中国证券监督管理委员会、上海证券交易所、 深圳证券交易所、各证券公司等单位的网站数据库和出版 发行的刊物中取得有关数据。各上市公司的季报、半年报、 年报中的各种数据属于公开数据,可以直接使用,但如果 存在后续的补充报告,在使用时应该及时调整。
对于未公开的微观经济数据,由于涉及企业的内部机 密或个人的隐私权,我们在采用有关数据时一定要征得相 关单位和个人的同意,在发表研究成果时还应尽量避免直 接公布原始数据。
2020/10/8
版权所有 BY 统计学课程组
8
刊登世界各国宏观数据的刊物主要由联合国统计司 (UNSD)、世界银行(WB)、国际货币基金组织(IMF)、 世界贸易组织(WTO)、世界卫生组织(WHO)、国际 能源机构(IEA)、国际清算银行(BIS)、欧盟统计局 (EUROSTAT)、亚洲开发银行(ADB)、国际电信联盟(ITU) 等国际性组织编制出版。有些使用面广的资料,在取得版 权后,由我国有关机构翻译成中文出版。例如《世界经济 年鉴》、《世界发展报告》、《国外经济统计资料》等。
2020/10/8
版权所有 BY 统计学课程组
12
(一) 统计调查方式 (2)
1.普查(census) 定义2.1 一个国家或一个地区为详细地了解某项重要
的国情、国力而专门组织的一次性、大规模的全面调查, 称为普查。 普查主要用来调查属于一定时点上现象的总体特征, 如全国人口普查、国有资产普查、全国工业普查、全国第 三产业普查等。 相对于全面统计报表,普查能取得内容更详尽、分类 更细致的统计资料,但普查耗费的人力、物力、财力较多, 不宜经常进行,而应根据实际需要间隔一定的时间进行, 比如我国从1990年起每隔10年进行一次全国人口普查。
版权所有 BY 统计学课程组
2
学习目标
通过本章的学习,正确理解各种调 查方法的概念、作用与特点,明确相 互的区别;掌握统计数据整理的方法 ; 能够正确使用统计图表展示数据。
2020/10/8
版权所有 BY 统计学课程组
3
案例2 中国已经是世界强国了吗
问题: 1.这些数据资料是怎样收集的? 2.调查方案包含哪些内容?怎样