第二章-数据的收集与整理.

合集下载

第2章统计数据的搜集与整理精品PPT课件

第2章统计数据的搜集与整理精品PPT课件

▪ 优点:应用范围广、结果正确、直接
▪ 缺点:成本高、研究时间长。
统计学
2-15
统计调查的组织方式
►统计报表
▪ 依据国家统计局或国家各行政管理的规定,自上而下 地统一布置,以一定的原始记录为依据,按照统一的 表式、指标、时间和程序自下而上地逐级提供基本统 计资料的调查方式。
►专门调查
▪ 普查
▪ 抽样调查
▪ 重点调查
►重点单位是指在全体中虽然数目不多,所占比不 大,但调查标志值却占较大比重。
▪ 典型调查
►有意识地选择有典型意义或具有代表性的单位。
统计学
2-16
统计报表
►是我国定期搜集基本统计资料的一种重要形式。 ►特点
▪ 来源于基层单位的原始记录 ▪ 项目稳定,有利于资料积累和动态比较
►种类
▪ 国家、部门和地方统计报表 ▪ 全面统计报表和非全面统计报表 ▪ 定期报表和年报 ▪ 基层表表和综合报表 ▪ 电讯报表和书面报表
►统计调查方法
▪ 现场观察法、报告法、问卷法、访谈法、实验 采集法等。
►统计调查的组织方式
▪ 统计报表 ▪ 专门调查
统计学
2-12
抽样调查方案
►确定调查目的(为什么调查) ►确定调查对象和调查单位
▪ 有许多性质相同的调查单位组成的现象总体。 ▪ 调查单位:所要研究的个体。
►确定调查项目:调查中所要调查单位的特征。 ►设计调查表与问卷设计 ►选择调查方法 ►确定调查时间和调查期限 ►制定调查的组织实施计划
统计学
2-13
统计调查方法
► 现场观察法
▪ 带有明确的目的到现场,直接观察获得数据信息。 ▪ 优点:准确;缺点:成本大
► 报告法(通讯法)

第二章 数据收集与整理

第二章  数据收集与整理

《统计学》习题(2013版)第二章数据收集与数据整理一、判断题1.观测单位就是统计数据的提供单位。

2.普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确。

3.无论是概率抽样还是非概率抽样,误差都是可以计算的。

4.偶然性误差只存在于抽样调查,观测性误差则可能存在于任何统计调查。

5.为了尽可能多地收集统计数据信息,所以问卷应尽可能地长。

6.统计分组应使组间差异尽量小。

7.凡是离散型变量都适合编制单项式数列。

8.各组的频数或频率都是可以直接比较的。

二、单项选择题1.最常用的统计调查方式是()。

A.普查B.重点调查C.抽样调查D.科学推算2.调查小学男生的身高,则身高是()。

A.观测标志B.观测单位C.调查对象D.变量值3.抽样调查中不可避免的误差是()。

A.系统性误差B.偶然性误差C.观测性误差D.登记性误差4.在组距式数列中,对组限值的处理原则是()。

A.上组限不在内、下组限在内B.下组限不在内、上组限在内C.上下组限均不在内D.上下组限均在内5.最常见的变量分布类型是()。

A.正J型分布B.U型分布C.钟型分布D.反J型分布三、计算分析题某生产车间55名工人日加工零件数如下:(单位:件)117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 140 108 150 118 123 126 133 134 127 123 118 141 112 112 134 127 123 119 113 120 123 127 143 135 137 114 120 128 124 115 139 128 124 121 110 140 118要求:(1)编制频数分布数列和频率分布数列;(2)编制向上、向下累计频数分布数列和累计频率分布数列;(3)绘制直方图、折线图、曲线图和累计分布曲线图(可利用Excel);(4)说明工人日加工零件数的分布特征。

统计学 第二章 统计数据的搜集、整理和显示

统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。

数据的搜集与整理讲解

数据的搜集与整理讲解

第二章、数据的搜集与整理统计工作总是从收集资料开始的,但由于生产和实践过程中收集到的资料和数据往往是分散的,而且从表面上看不出有什么规律性,也不能说明任何问题,必须经过整理和归纳后,这一批数据所遵循的规律才能显露出来,方可得出有意义的统计结论。

数据的收集数据的整理数据的收集从理论上讲,进行大量观测、试验,就可以清楚地掌握随机现象的统计规律。

但有时大量试验客观上是不允许的(如破坏性试验),这时只能得到有限的,甚至是很少的数据,以什么样的方式收集资料更为有效?——抽样抽样例子:国家医护协会对于医护专业未来护士的缺乏十分关注。

为了了解现阶段护士们对于工作的满意程度,该协会发起了一向对全国的医院护士的调查研究。

作为研究的一部分,一个由50名护士组成的小组被要求写出她们对工作、工资和升职机会的满意程度(见表一)几个概念总体(population):全国的医院护士---研究对象的全体/或研究对象的某项数量指标X的值的全体。

一般用X表示。

样本(sample):被抽到的这50名护士--总体中抽出若干个体所组成的集合。

一般用XX2…X n表示一个样本容量为n1的样本。

抽样的目的!1. 总体?全体医护人员对工作的满意度 3. 这50 名护士对工作的满意度资料2. 样本! 被抽到的50名 护士4. 将样本的结论推广到总体上抽样抽样调查的应用抽样方法抽样方法的优点抽样调查中应当注意的问题抽样方法的优点费用较低速度较快应用范围较广准确度较高费用较低如果数据是从总体的一个很小的部分取得,那么他的费用就比普查小。

在美国,政府说进行的最重要的经常性调查,使用的样本在105,000人左右,或者说大约从1240人中抽取一个人。

在市场研究中,可能只要对几千人的样本进行调查。

速度较快收集和综合样本资料要比收集和综合全面调查的资料更快些。

在迫切需要有关的信息时,考虑这一点是极为重要的。

应用范围较广就能取得的信息的种类来说,抽样调查可以发挥作用的范围更为宽广,而且具有更大的灵活性。

统计学2. 数据的收集与整理

统计学2. 数据的收集与整理
1.统计年鉴:《中国统计年鉴》、《国际统计年鉴》、地方
统计年鉴、《中国县(市)社会经济统计年鉴》、《中国金 融年鉴》、《中国人口和就业统计年鉴》、《中国统计摘要 》……
2.外文出版物:世界银行各年度的《世界发展报告》、联合
第一节 统计数据的搜集
三、统计调查的各种形式: 统计调查的形式:指统计调查的组织形式,
即组织统计调查,搜集信息资料的方式。
普查、统计报表制度、抽样调查、重点调查和 典型调查。
核心在于如何选取调查对象。
统计调查方法:获取数据的方法。
直接观测法、报告法(通讯法)、采访法、登记法、 电话访问法、网络调查法、试验设计法。
3. 调查项目一经确定,不能随意改变或增减,以免影响 汇总总和,降低资料质量。
普查的组织形式:
专门组织普查机构并配普查人员直接登记(人口普查); 利用原始资料由调查单位自填表格(物资库存普查)
第一节 统计数据的搜集
三、统计调查的各种形式:2、统计报表制度:
统计报表是依照国家有关法规(《中华人民共和 国统计法》),自上而下的统一布置,以一定的 原始记录为依据,按照统一的表式,统一的指标 项目,统一的报送时间和报送程序,自下而上地 逐级地定期提供统计数据的一种调查方式。是搜集
三个基本特征:
① 按照随机的原则抽取单位,排除个人主观意图的 影响;
② 对一部分单位(样本)做深入细致的调查研究, 取得数据,并据此从数量上推断总体。
③ 抽样误差可以事先计算并加以控制。
第一节 统计数据的搜集
三、统计调查的各种形式: 3、抽样调查: 适用范围:
① 不可能或很难进行全面调查的现象,必须采取抽样调查 方法。如产品寿命等;
核心在于如何获取数据。

统计学第二章数据搜集整理

统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)

n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合

统计学(4)

统计学(4)
第三,由于统计报表属于经常性调查,调查项目相对 稳定,有利于积累资料并进行动态对比分析。
.
第一节 数据的收集
统计报表
按实施 范围分
按调查 范围分
按主管 系统分
按填报 单位分
按报送 方式分
国部地 全 非 基 专 基 综 电 书 家门方 面 全本 业 层 合 讯 面 统统统 统 面统 统 报 报 报 报 计计计 计 统计 计 表 表 表 表 报报报 报 计 报 表 表表表 表 报表 报
明确规定调查资料的起止时间; 调查资料登记时间:是指对调查单位进行调查并取得调
查资料的时间; 调查工作期限:是指从调查工作开始到调查工作结束所
经历的全部时间。 2.调查空间: 调查单位应在什么地点接受调查。
.
第一节 数据的收集
(五)制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。 调查的组织实施计划应包括以下内容: ➢ 建立调查工作的组织领导机构,做好人员的配备与分工; ➢ 做好调查前的准备工作。如宣传教育、人员培训、文件
重点单位:是指这些单位的标志总量在总体标志总量中占 有绝大比重的单位。
选取重点单位的原则:根据调查任务和调查对象的基本情 况确定选取的重点单位及数量;也要注意选取管理比较健全、 业务能力强、统计工作基础好的单位为重点单位。
特点:调查单位少;调查对象的标志值比较集中于某些单 位的场合。
注意:重点单位的选择是客观的。只适用于客观存在着重 点单位的情况。
注:1.资料来源于《世界概况》,由美国中央情报局(CIA出版)最权威报道; 2.中国2010年人均GDP为4283美元,居世界182个国家的95位。
.
第一节 数据的收集
1.定类尺度(类别尺度、列名尺度) 是对统计客体类别差异所作的反映,是最粗略、计量层次 最低的测量尺度。

第二章 统计数据的收集与整理

第二章 统计数据的收集与整理

问句的设计
1)自由回答式问句 ●事先不拟定任何具体答案,让被调查者 根据自己的意愿或感觉自由回答问题。
例:你喜欢那种牌子的洗衣粉? 牌
你认为学校食堂有哪些需要改进的地方? 。
2)是否式问句 ●答案只分两种情况,受访者需两者择其 一。
例:你是否愿意考研? 是( ) 否( )
你今年是否打算买自行车? 是( ) 否( )
2)问题设计应用语要准确 ●用词应避免引起歧义,尽量避免使用诸 如“经常”、“有时”、“偶尔”、“可 能”、“好像”之类词语。
例:欲调查广大师生的出行情况,设计问题 如下:
◆你近来经常去市区吗?
近来、经常
3)避免提出诱导性问句 ●切忌先入为主。
例:◆一般人都认为HP笔记本电脑比较好, 你也这样认为吗?
3)多项选择式问句 ●对一个问题事先列出三个或三个以上可能 的答案,让被调查者根据实际情况,从中选 择。
例:某饭馆欲了解本店在同类饭馆中的市场占有率 有朋自远方来,你首选哪家饭馆? A. 老四川( ) B. 小四川 ( ) C. 新四川( ) D. 四川酒家( ) E. 其他( )
4)排序式问句
收集分析市场数据 //掌握SPSS统计软 件//撰写调研报告
收集分析市场数据
制造业 制造业
3-5年 1-3年
本科
设计调查问卷 // 分析市场数据
咨询
5-10年
硕士 本科
收集分析市场数据//设计调查问卷 // 掌握SPSS统计软件 // 撰写调研报告
协助设计调查问卷
咨询 咨询
不限 不限
本科
收集分析市场数据 //对数据有敏锐洞
(2)方案实施 (3)数据采集:测量实验结果 (4)数据分析:方差分析 (5)优化生产
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

制度化的 经常性调查 专门组织的 一次性调查
2-20
统计报表制度(statistical report forms)
概念: 由政府部门组织,采用统一的表格,自 上而下布置,自下而上报告。 任务: 搜集国民经济和社会发展基本情况的资 料,为制订国民经济和社会发展计划和 检查计划执行情况服务。 优点: 能保证统计资料的全面性和统一性 能保证统计资料的连续性和及时性 能满足各级部门对统计资料的需要 缺点: 统计报表过多会增加基层负担 有可能由于虚报瞒报而影响统计资料质量
决定着统计认识过程及其结果的成败
主要包含如下三方面的内容: 统计调查方案的设计 统计调查方法 统计调查的组织形式
2-5
次级资料的主要收集渠道:
⒈查阅公开出版物; ⒉向政府统计机构咨询; ⒊向其他机构咨询; ⒋网上查询。
2-6
常用的统计数据来源
美国经济分析局 美国人口普查局 美联储经济数据库/fred 中国国家统计局 上海市统计局 世界银行 国际货币基金组织 OECD
– 尽可能简短,只保留调查所必须的关键问题
• 调查方式(Mode of Response)
– 面谈 – 电话访问 – 信函调查 回答率较高,费用较高 居中 回答率较低,费用较低
• 问题设计(Formulating Questions)
– 语言简明易懂,避免含糊其词 – 考虑完备而避免重复
2-17
调查单位中吸 烟人所占比例 ⒈您是否吸烟(如果选②,则跳过 2、 3题)
2-15
问卷设计的基本要求:
主题明确
提问科学 逻辑性强
问题的提出要紧扣主题 问句和标准答案要易于理解 和回答
先易后难、先封闭后开放、 先基本问题后派生问题
容量适度
以不超过20分钟为宜
2-16
问卷设计
Questionnaire Design
• 问卷的长度(Questionnaire Length)
2-22
重点调查(key point survey)
概念: 在总体中选择个别或部分重点单位进行调查。
重点单位指在总体中有举足轻重地位的单位, 其标志值在总体标志总量中占有绝大比重。
任务:及时了解总体基本情况,为主管部门指导工 作服务。
方式: 一次性调查;专门设计和备配人员现场调查。 经常性调查;同报表制度结合,用统计报表 调查。 特点: 能以较少的投入和较快的速度取得总体基 本情况及变动趋势的资料;只适用于客观 存在重点单位的情况
2-7
返回
2-8
统计调查方案的设计
统计调查方案:用来指导整个调查工作的纲领性 文件,是统计设计在统计调查阶段的具体化
组织调查之前统计调查方案的设计内容: 1、明确调查目的(为什么调查?) 2、确定调查对象和调查单位(调查谁?) 3、确定调查项目(调查什么?) 4、调查表与问卷设计 5、确定调查时间和调查期限 返回 6、制定调查的组织实施计划
调查问卷的基本格式: 说明词:解释调查意
表头 表体 表脚 义、表达感激之情等
主题问句:被调查者
基本情况、调查项目
作业记录:时间、操
作者等
2-14
调查问卷的问题类型:
封闭式问题 开放式问题 您认为吸烟有哪 些害处? 您认为吸烟有 您认为吸烟有 ①危害自身健康 哪些害处? 哪些害处?
②影响他人健康 ①危害自身健康 容易造成人际 ②影响他人健康 ③浪费钱财 关系紧张 容易控制, 不易控制, ③浪费钱财 ④容易引起火灾 但不易全面 但内容丰富 ④容易引起火灾 ⑤破坏家庭团结 ⑤破坏家庭团结 ⑥其他 。
2-9
统计调查方法
现场观察法
被调查者受调 查者的强制与 约束
调查者与被调 查者平等合作
报 告 法 问卷法 访谈法 实验采集法
2-10
现场观察法
2-11
报告法
调查者
强ห้องสมุดไป่ตู้、约束
2-12
访问调查
调查者
平等合作
被调查者
返回
2-13
问卷调查
主要指非政府性统计机构或个人所 从事的对人的主观意见的调查工作, 也称作民意调查或民意测验
①吸烟 ②不吸
⒉您每天大约吸多少支烟 ①5支以下 ②5-10支 ③10-15 支 吸烟人群吸烟 ④15-20 ⑤20-25支 ⑥25 支以上 历史情况 ⒊您的吸烟历史大约有多长 调查对象对吸 ①1年以下 ②1-5年 ③5-10年 烟的看法 ④10年以上 ⒋您是否认为吸烟有害健康(请写出理由)
返回
吸烟人群日吸 烟数量情况
2-18
统计调查的种类
按调查单位的范围大小分为 非全面调查
全面调查
按调查时间是否连续分为 按调查的组织方式不同分为 普查 统计报表 专门调查 重点调查 经常性调查 一次性调查
典型调查
抽样调查
2-19
统计调查的组织形式
全 面 调 查 非 全 面 调 查
统计报表 普 查 重点调查 典型调查 抽样调查
统计分析
描述性分析
推断分析、 决策分析。
要求:定性
定量结合
完整、及时
浓缩简化
2-3
数据来源
Data Sources
数据 来源
直接来源
间接来源
试验
问卷调查
观察
出版物 (或者网上)
2-4
1 数据的收集
1.1 数据的来源
原始数据和次级数据
1.2 统计调查
统计调查是统计资料收集的主要形式,是统计工作过程的 第一阶段。 重要性: 统计调查是整个统计认识活动的基础,
2-21
普查(census)
概念: 指国家为详尽了解某项重要的国情国力 而专门组织的一次性全面调查 建立专门机构,配备专门人员调查。 任务: 搜集重要的国情国力和资源状况的全面资 料,为政府制定规划、方针政策提供依据。 利用基层单位原始记录和核算资料发表调查。 特点: 工作量大,时间性强,需要大量人力和财力。 特别领域,专门组织;一次性;全面性 原则:规定统一的标准时点。 规定统一的普查期限。 规定调查的项目和指标。
Statistics 2-1
第二章 数据的收集和整理
2
通过本章的学习,我们应该知道: 1. 数据来源 2. 数据是如何收集的 3. 数据是如何整理的 4. 如何做次数分布表
2-2
统计工作的三个中心阶段
统计调查
有组织、 有计划地 搜集资料。 要求:准确、
统计整理
对调查资料 去伪存真、 去粗取精、 科学分类、
相关文档
最新文档