统计学第二章 统计数据的收集(2017)
数据的收集与统计

数据的收集与统计数据的收集与统计是现代社会中重要的工作之一。
通过有效地收集和统计数据,我们能够了解并分析各种现象和趋势,为决策提供科学的依据。
本文将从数据的收集和统计方法、数据的应用以及数据分析的挑战等方面进行论述。
一、数据的收集方法数据的收集是用户了解和掌握所需的基本数据的过程。
为了保证数据的准确性和完整性,以下是一些常见的数据收集方法:1.问卷调查:通过设计问题和分发问卷来获取被调查者的意见和看法。
问卷调查可以通过线上或线下方式进行,确保样本的广泛性和代表性。
2.观察法:直接观察现象并记录下相关数据。
观察可以是主动的,也可以是被动的,取决于研究的目标和对象。
3.访谈法:与个人或群体进行面对面的交流,并记录相关数据。
访谈可以是结构化的,按照事先准备好的问题进行;也可以是非结构化的,根据实际情况自由对话。
4.文献研究法:收集已有的文献、报告或统计数据,并进行分析总结。
这种方法适用于已有大量研究成果的领域,并可以作为研究的参考。
二、数据的统计方法数据的统计是对收集到的数据进行处理和分析的过程。
以下是一些常见的数据统计方法:1.描述性统计:对数据进行整理、分类、归纳和描述。
常见的描述性统计方法包括频数分布、均值、中位数、众数和标准差等。
2.推论统计:通过对样本数据的分析得出总体特征的推断。
推论统计通常使用抽样方法,如随机抽样、系统抽样和分层抽样等。
3.回归分析:通过建立数学模型,研究自变量和因变量之间的关系。
回归分析可以用于预测和解释变量之间的相互影响。
4.因子分析:用于分析变量之间的相关关系,从而确定主要因素。
因子分析可以帮助理解复杂的数据结构和变量之间的相互作用。
三、数据的应用数据的应用涉及各个领域,以下是一些数据应用的例子:1.市场调研:通过分析市场数据,了解产品需求、竞争态势和消费者行为,为企业制定市场策略提供依据。
2.医学研究:通过统计疾病发生率、死亡率和治疗效果等数据,推导出有效的预防和治疗方法,促进健康和医疗的发展。
统计学:统计数据的收集、整理与显示习题与答案

一、单选题1、抽样调查中,抽取样本必须遵循什么原则。
()A.随机原则B.随意原则C.对等原则D.可比原则正确答案:A解析:随机抽样也叫概率抽样,即总体中的个体有一个事先已知的概率被抽中。
2、某市工商企业2017年生产经营成果的年报呈报时间规定在2018年1月31日,则调查期限为()。
A.一个月B.一年C.一日D.一年零一个月正确答案:A解析:调查期限:调查工作进行的起迄时间。
3、次数分布的类型主要取决于()。
A.变量是连续还是离散B.统计总体所处的条件C.社会经济现象的性质D.分组标志的选择正确答案:C解析:社会经济现象的性质决定了社会经济现象呈现何种分布。
4、以下有关典型调查的表述不正确的是()。
A.必须同其他调查结果结合起来使用B.不容易受人们主观认识上的影响C.可以检验全面调查数据的真实性D.能够补充全面调查资料的不足正确答案:B5、重点调查中重点单位是指()。
A.标志总量在总体中有很大比重的单位B.具有反映事物属性差异的品质标志的单位C.能用以推算总体标志总量的单位D.具有典型意义或代表性的单位正确答案:A二、多选题1、采用类型抽样的组织形式是()。
A.最符合随机原则B.需要对总体各单位进行分组C.适用于总体各单位标志值差异较大的总体D.组内是进行全面调查正确答案:B、C解析:类型抽样是将总体全部单位按有关标志分成若干层,然后按照随机原则从每层中分别抽取样本单位组成样本,适合于差异大的总体,能使样本结构更接近于总体结构,提高样本的代表性。
2、在组距数列中,组中值是()。
A.在开放式分组中,可参照相邻组的组距来确定B.上限和下限之间的中点数值C.在开放式分组中无法确定D.就是组平均数正确答案:A、B解析:组中值是下限与上限之间的中点值,是在假定各组内均匀分布时的一个近似值。
闭口组的组中值是上限与下限的简单算术平均数;开口组组中值的确定,一般以其相邻组的组距的来调整3、对于离散型变量数列()。
统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
统计学原理(第二章)

East China University of Science And Technology
第二章 数据收集 (统计调查)
主要内容
2.1 数据的计量和类型 2.2 统计数据的收集 2.3 统计调查方案设计 2.4 统计报表制度 2.5 专(项)门调查 2.6 次级资料的收集
本章学习目标……
调查的目的
2006年全国开展第二次农业普查; 其目的是: 1)收集年度间变动缓慢的农业结构性数据 2)为抽样调查提供样本框。 主要调查:农业生产经营单位的数量、规模和 结构;耕地资源;农业生产条件;劳动力就业 和流动;农村社会福利事业等基本内容
调查的目的
2009年上海市第二次全国R&D资源清查的目的 1.全面调查了解R&D活动的总体规模和分布情况 2.研发队伍的规模和素质状况 3.研发资源的投入、成果及产出效益情况 4.政府对R&D活动扶持政策的落实情况
2.2.2 统计调查的种类
1)统计报表制度和专门(项)调查 2)全面调查和非全面调查 3)连续性调查和非连续性调查 4)直接观察法和询问调查法
统计报表制度和专门调查
1)统计报表制度: 是收集统计资料的一种重要方法,是按照国家有关法规的规定, 自下而上的逐级提供基本统计资料的一种调查方式。如统计公报。 2)专(项)门调查: 为了研究某个专(项)门问题而组织的调查方式,有普查、重 点调查、典型调查、抽样调查。 如: 2008年,奶粉三聚氰胺含量的专项调查; 2009年8月8日,台湾水灾人员伤亡情况调查(台风‘莫拉克’) 人民币升值对出口企业的影响调查; 房贷利率升高对贷款者还贷的影响调查
2.3.4确定调查时间
调查时间有两层含义: 1)确定调查的起止时间,即调查期间。 第二次经济普查的调查时期为: 2009年1月1日—5月31日。 2)确定资料所属的时期或时点。 第二次经济普查的标准时点为: 2008年12月31日24时。 第二次经济普查的时期资料为2008年度。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示

– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
统计调查统计数据的收集与整理ppt

-
22
(二)次级资料收集方法
次级资料又称二手资料,是指他人为了 自己的研究目的而调查、整理的资科。
1.根据研究项目的内容判别所需资料的类型 2.寻找资料的来源 3.对次级资料的查找 4.对查找的资料进行甄别、清理、补充
-
14
(4)统计报表(制度)
Statistical Report Forms 按照国家统一规定的表格形式,定期地、
自 上而下布置,自下而上填报统计资料的一种调 查形式。 特 点:已经形成一种制度;可以组织全面、非 全面调查。 类 型:国家统计报表、业务统计报表、地方统 计报表;
半月报、月报、季报、半年报、年报。 用 途:用于搜集全面的基本情况,也为重点调 查等非全面调查所采用。
统计学
Statistics
-
1
第二章 统计数据的收 集与整理
第一节 统计数据收集
-
2
一、收集资料的方式 概括起来分为直接方式和间接方式
(一)统计资料的直接收集
主要包括统计调查和试验设计
(二)统计资料的间接收集
通过各种渠道收集第二手资料
-
3
(一)统计资料的直接收集
1.统计调查
统计报表
按调查组织形式
数据的搜集方法
询问调查
观察实验
访邮电 问寄话 调调调 查查查
座个 谈别
深 会访
-
观
实
察
验
20
二、收集资料的方法
数据资料的收集方法可以分为初级资料收 集方法和次级资料收集方法或称文案资料。
(一)初级资料收集方法 ➢ 1.访问法
访问法是按所拟调查事项,有计划地通过访谈 询问方式向被调查者提出问题,通过他们的回答来 获得有关信息资料的方法。
《统计》统计与概率(数据的收集)

方差的平方根,与方差具有相同的量纲,也反映数据的离散程度。
四分位数
将数据按大小顺序排列,分成四个等份,中间两个数即为四分位数 ,反映数据的离散程度和异常值情况。
数据的分布形态
直方图
将数据按大小顺序排列,并统计每个数据区间内数据的个数,以条形 图的形式表示数据的分布情况。
箱线图
将数据按大小顺序排列,并计算上下四分位数、上下异常值、中位数 等统计量,以箱线图的形式表示数据的分布情况。
变量组合
将多个变量组合成一个新 变量,以便于进行综合分 析。
数据可视化
图表绘制
使用各种图表类型(如柱状图、 折线图、散点图等)来直观展示
数据之间的关系和分布情况。
数据分布展示
通过直方图、箱线图等展示数据 的分布情况,以便于发现数据的
异常值和离群点。
对比分析
通过对比不同组别或不同时间点 的数据,来分析数据的变化趋势
茎叶图
将数据按十位数和个位数分别列出,以茎和叶的形式表示数据的分布 情况。
频数分布表
将数据按大小顺序排列,并统计每个数据区间内数据的个数,以表格 的形式表示数据的分布情况。
04
概率论基础
随机事件及其概率
1 2
随机事件定义
随机事件是样本空间中的元素,是样本空间的一 个子集。随机事件的发生与否是不确定的。
意数据的真实性和可靠性。
线下调查
通过纸质问卷、面对面访谈等方式 收集数据。这种方法可以更好地控 制数据的质量,但需要更多的时间 和人力成本。
混合调查
结合线上和线下两种方式收集数据 。这种方法可以综合两种方式的优 点,提高数据的质量和效率。
数据的质量控制
数据清洗
对收集到的数据进行清洗,去除异常 值、重复值等,确保数据的准确性和 可靠性。
统计学考试题目

11、由于统计工作失误而造成的误差被称作非抽样误差。( )
12、饼形图一般用来表示数据的变化特征和大小。( )
13、变异系数的值越大,说明平均数的代表性越小。( )
一、A B C C D D A A D A DDCDD B C
1.统计报表依据自下而上的行政手段保证统计报表制度的实施。( )
2.在统计工作中为保证变量的分组不发生混乱,习惯上规定各组一般均只包括本组下限变
量的单位,而不包括上限变量值的单位,这就是上限不在内原则。( )
3.在பைடு நூலகம்行统计分组时,技术上应满足完备性、互斥性和一致性。( )
4.当标志值变动很不均匀,如急剧地增大或减小,变动幅度大时,可采用等距分组。( )
出金额的近似值,此为(A)。
A、典型调查 B、重点调查
C、抽样调查 D、普查
9.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为(D)。
A、动态相对指标 B、结构相对指标
C、比例相对指标 D、比较相对指标
10.有12 名工人看管机器台数资料如下:2、5、4、4、3、3、4、3、4、4、2、2,按以上资料编制分配数列,应采用(A )。
5.国内生产总值、社会总产品和人口密度均为总量指标。( )
6.比较相对指标是将两个同类指标做静态对比得出的综合指标。( )
7.直方图仅适合用于显示连续型分组数据。( )
8.对在校大学生的年龄进行分组适合采用组距式分组。( )
9.如果一组数据呈正态分布,则算术平均数的大小不会受极端值的影响。( )
13、下列数据属于连续型数据的是( C)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Statistics
Statistics
• 优点:提供的信息量大 • • 缺点:1、灵活性、时效性差 • 2、提供的资料具有相对可靠性
Statistics
2、种类:
• (1)按实施范围不同分 • 统计报表可分为国家统计报表、部门统 计报表和地方统计报表
Statistics
国家统计报表
• 是根据有关国家统计调查项目和统计调 查计划制定的统计报表,也称为国民经 济基本统计报表。 • 例如 • 国民经济核算统计报表 • 工业统计报表固定资产投资统计报表
Statistics
• (四)按照搜集资料的具体方法不同,统计 调查可以分为
• 直接观察法 • 报告法 • 采访法 • 问卷调查
Statistics
• 1、直接观察法:是指调查人员或核算人员 到现场对调查对象进行直接清点、检验、 计算、测量的一种调查方法。
Statistics
• 2、报告法是以各种原始和核算凭证为调查 资料来源,依据统一的表格形式和要求, 按照隶属关系逐级向有关部门提供统计资 料的方法。
Statistics
• 调查目的决定着 • 调查对象 • 调查内容 • 调查方法
•
Statistics
二、确定调查对象和调查单位
• •
1、调查对象: 是根据调查目的确定的、需要进行调查 研究的某一社会经济现象的总体,即总
体。
• 说明向谁调查问题
Statistics
• 1999年人口普查规定: • “人口普查对象是具有中华人民共和国国 籍并在中华人民共和国境内常住的人”。
Statistics
• 统计调查是 统计整理、统计分析的基础,在整个统 计工作中,担负着提供基础资料的任务, 是一切统计资料的来源。 • 统计调查工作的质量如何,直接影响到 整个统计工作的质量。
Statistics
二、统计调查的要求
• • • • 1、准确性 2、及时性 3、全面性 4、经济性
Statistics
Statistics
• (4)列入的调查项目或标志的含义要明确 具体,做出统一的解释或提示,以免调 查人员或被调查者按照各自不同的理解 填写,造成结果无法汇总。
Statistics
• (5)对于规模大而又缺少经验的统计调查, 需要进行试点调查,根据试点工作中发 现的新问题和新情况,对调查方案作必 要的补充或修正。 • 还可以积累实施调查方案的经验,提高 调查人员的业务技能,圆满完成调查任 务。
Statistics
• 这三类报表的内容各有侧重,但相互关 联。 • 国家统计报表是统计报表体系的基本组 成部分 • 部门统计报表和地方统计报表是国家统 计报表的补充。
Statistics
(2)按报送周期长短分
• 统计报表分为日报、周报、旬报、月报、 季报、半年报和年报
• 统计调查方案又称统计调查计划,亦即 组织统计调查必须解决的基本问题,主 要包括以下几项内容。
• • • • • • •
在实施统计调查之前,应当明确 Statistics 由何人主持调查及向谁调查?(who) 何时开始调查?(when) 在何地进行调查?(where) 调查的内容是什么?(what) 如何进行调查?(how) 五个问题,即统计学家通常所说的
Statistics
(三)做好各种准备工作
• • • • 1、调查的组织机构的设置。 2、调查人员的配备、培训。 3、文件印刷。 4、经费的预算和决算等。
Statistics
第三节 几种常用统计调查 方式
• 一、统计报表 • 1、概念: • 统计报表是我国定期取得统计资料的主 要方法,它是按照国家调查文件的统一 规定,自下而上逐级提供统计资料的一 种调查方式,也是一种定期的统计报告 制度。
Statistics
(二)确定调查地点:
• 调查地点是指登记调查资料的地点。 • 通常,调查地点和调查单位所在地点是 一致的。 • 例如 • 企业的报表就是在企业所在地编制的
Statistics
• 但在两者不一致的情况下,必须明确规 定进行调查的地点。
• 例如,进行人口调查登记时,如果调查 “常住人口”,不论被调查者是否暂时 外出居住,都应在每个居民的常住地点 进行登记。 •
Statistics
2、专门调查
• 是指为了研究某一特定情况或问题而专 门组织的调查。
Statistics
• 专门调查包括 • 普查 • 重点调查 • 抽样调查
Statistics
• (二)按调查对象的范围不同,统计调查可以 分为 • 全面调查 • 非全面调查
Statistics
• 1、全面调查:就是对调查对象所包括的所 有调查单位都进行调查。 • • 包括:普查、全面统计报表
• 这种方法又称凭证法。
Statistics
• 3、采访法是指通过指派调查员对被调查者 询问、采访,提出所要了解的问题,借以 搜集资料的方法。 •
Statistics
• 4.问卷调查是由调查人员将统一设计的问 卷发给被调查者,填写后回收以获取统 计资料的方法。
Statistics
四、统计调查的步骤
Statistics
• (2)要从实际出发,只提出能够取得确切 资料的项目。
• 有些虽属需要,但还没有条件取得资料 的项目,就不该列入。
Statistics
• (3)列入的调查项目之间尽可能相互联系, 以便对有关项目相互核对和检查错误, 资料汇总后也便于分析总体的实质。 • 同时,还应考虑此次调查项目同以往同 类调查项目之间的衔接,以便进行动态 对比,研究现象的发展变化情况。
Statistics
第二章 统计数据的收集
本章内容概述 通过本章的学习,要求理解统计调查的涵 义和作用;熟悉统计调查的分类;熟练 掌握普查、重点调查、抽样调查和统计 报表四种统计调查方式的特点和应用条 件;掌握统计调查方案的设计方法。
Statistics
教学目的和要求
• 拥有一定的资料是统计工作的基础,而统计调 查正是为了获取这些资料,统计调查是统计工 作的第二阶段。通过本章的学习,使学生了解 搜集统计资料的一些基本知识,如明确向谁调 查?何时开始调查?在何地进行调查?调查内 容是什么?如何进行调查?
• 对普查来说,统一规定的时点称为标准 时间。
Statistics
2、调查期限
• 是进行调查工作的起讫时限,包括 • 搜集资料和报送资料的时间。 • 为了保证统计资料的及时性,必须设法 缩短调查期限。
Statistics
• 例:会计报表制度规定,每一个企业在 每月初(一般是1-10号)必须向有关部 门报送资产负债表和损益表。 • • 我国《证券法》规定,上市公司的年报 工作必须在次年4月30日前完成。
Statistics
• 2、调查单位: • 是调查到的那些总体单位,是在调查过程 中应该登记其标志的具体单位。
• 人口普查中上述总体中的每个人
Statistics
• 在全面调查中 • 调查单位=总体单位
• 在非全面调查中 • 调查单位只是部分总体单位 •
Statistics
3、填报单位(报告单位):
Statistics
(二)调查表:
• 调查项目确定后,把它们按照一定的顺 序排列在表格内,形成调查表。
Statistics
调查表的种类
• 1、单一表: • 在一张表上只登记一个调查单位,可以 容纳较多的标志。
Statistics
• 2、一览表: • 在一张表上登记若干个调查单位。
Statistics
• 1、设计统计调查方案 • 2、组织实施统计调查方案 • 3、组织编报统计资料
Statistics
第二节 统计调查方案
• 进行统计调查时,必须全面地计划,严 密地组织,事先要制订统计调查方案, 以便在调查过程中统一认识、统一内容、 统一方法、统一步调,顺利完成统计调 查的任务。
Statistics
Statistics
• 调查企业设备情况时,调查单位是企业 的各种设备,而填报单位则是企业。
三、拟定调查项目和调查表(调 查内容)
(一)调查项目:
Statistics
调查的具体内容,即统计标志,它的承担 者是总体单位。
是调查方案的核心部分
Statistics
确定项目应该注意以下几点:
• (1)只列入为实现调查目的所必需的项目, 只登记与问题本质有关的标志,不应包 括可有可无、备而不用的标志,以免内 容底杂,造成不必要的延长调查时间, 影响调查工作的质量。
四、制定调查组织实施计划
• (一)确定调查时间和调查期限 • 调查时间:资料所属的时点或时期 • 调查期限:做调查工作的时间
Байду номын сангаас
Statistics
1、资料所属的时间:
• (1)对于时期现象: • 要规定资料所属时期的长短(一月、一季 或一年)和所登记的资料的起止时间。 •
Statistics
• (2)对于时点现象: • 要规定统一的时点,例如月末的库存额、 季末职工在册人员等;
• “4W1H”(Who、When、Where、What、 How)。
Statistics
• 调查者首先要根据需要与可能,制定科 学的调查方案,它是调查工作的依据, 是保证调查顺利进行的前提。 • 调查方案主要包括下列内容:
Statistics
一、确定调查目的
• 确定调查目的
• 就是要明确调查解决什么问题 • 搜集哪些资料 • 这是统计调查的首要问题。
三、统计调查的种类
• (一)按照组织形式的不同,统计调查可以 分为统计报表和专门调查
Statistics
1、统计报表
• 是国家统计系统和各业务部门为了定期 取得系统的、全面的基本统计资料而采 取的一种搜集资料的方式。