社会经济统计学第2章统计数据的搜集
统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示

– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
统计学基础复习提纲复习内容统计数据数据搜集

统计学基础复习提纲复习内容:第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。
重点内容:第一章统计和数据(1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。
(3)统计中的基本概念:总体与样本;参数与统计量;变量。
第二章数据搜集(1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计(3)统计数据质量第四章数据分布特征的测度(1)集中趋势的测度:平均数;中位数和分位数;众数(2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数(3)偏态与峰态度量:偏态系数;峰态系数第五、六章参数估计与假设检验(1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。
(5)总体均值的检验:大样本检验方法;小样本检验方法。
第七章相关与回归分析(1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。
(2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。
(3)利用回归房产进行估计和预测第八章时间序列分析与预测(1)时间序列的分解和描述:图形描述;增长率分析(2)预测方法的选择和估计(3)平稳序列的预测:移动平均法;指数平滑法(4)趋势序列的预测:线性趋势预测;非线性趋势预测平均数:x 二2 4 10 11| 14 151096 9.610(2-9.6)2(4-9.6)2 川(15-9.6)2n -110-12、一家公司在招收职员时,首先要进行两项能力测试。
在A 测试中,其平均分数是100分, 标准差是15分;在B 项测试中,其平均数是 400分,标准分数是50分。
统计学第二章

一、统计数据的类型和来源
1. 统计调查概述
(1)统计调查的定义和意义。 ①统计调查的定义。统计调查是按照统计任务的要求, 运用科学的调查方法,有计划、有组织地向社会实际收集各项 资料的过程。统计资料的收集内容有两方面:一是直接收集反 映被调查者的个体原始资料(又称初级资料);二是根据研究 的目的,收集已经加工、整理出来的,说明现象总体的第二手 资料(又称次级资料)。由于第二手资料来源于原始资料,因 而,统计调查的基本任务是收集社会经济现象的原始资料。
前两类数据也称定性数据或品质数据,后两类数据也称 定量数据或数量数据。
一、统计数据的类型和来源
二、 统计数据的直接来源
统计数据的直接来源主要有两个:一是专门组织 的调查,二是科学试验。专门调查有统计部门进行的 统计调查,也有其他部门或机构为特定目的而进行的 调查,如新产品投放市场前所做的市场调查。专门调 查是取得社会经济数据的重要手段,而科学试验是取 得自然科学数据的主要手段。
一、统计数据的类型和来源
(1)定类尺度。定类尺度也称类别尺度或列名尺度, 是最粗略、最低层次的计量尺度。这种计量尺度只能按照事 物的某种属性对其进行平行的分类或分组。
(2)定序尺度。定序尺度又称顺序尺度,是对客观现 象之间等级差别或顺序差别的一种测度。这种计量尺度不仅 可以将客观现象分成不同的类别,还可以确定这些类别的优 劣或顺序。
一、统计数据的类型和来源
(3)定距数据。定距数据也称区间类别数据,说明的是 事物的数量特征,能够用数值表示。其结果是由定距尺度计量 形成的,表现为数值,可进行加、减运算。
(4)定比数据。定比数据也称比率类别数据,说明的也 是事物的数量特征,能够用数值表示。其结果是由定比尺度计 量形成的,表现为数值,可进行加、减、乘、除运算。
统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
《统计学》教学课件 第二章 统计数据收集、整理与呈现

全面调查 非全面调查
普查、统计报表制度、抽 样调查、重点调查和典型 调查等是常见的统计调查 方式,其中普查即全面调 查,其余的为非全面调查。
1.普查 普查是根据特定研究目的而专门组织的一次性的全 面调查,以收集研究对象的全面资料。
目前,我国组织实施的普查主要包括人口普查、经济普查和 农业普查三种。
缺然点后:通过典细型致单分析位典的型选单位取以受认人识总为成功经验、找出失败 现(一3)定突的出倾选典向式性。,突出且选典典型式是调指查选结择总体教中训的或先观进察单新位生、事后物进的单情位况或。新生事 果物不作宜为典用型以单推位,算进全行面深入数细据致。的调查。
2.报告法
3.采访法
又称凭证法,指要求调查 由调查人员对被调查者进
对象以原始记录、台帐和 行采访,根据被调查者的
核算资料为依据,向有关 答复来收集数据的方法,
单位提供统计资料的方法。 包括面谈访问、电话访问、
邮寄访问 和网络访问等。
4.登记法 指当事人根据有关法制法规规定,在开展某些活动或 发生某事时,主动到有关机构进行登记,填写有关表 格,提供有关统计信息。
④滚雪球抽样。是一种针对稀疏总体进行的抽样调查,抽选样本时 先找到几个符合条件的调查单位,然后通过这些调查单位找到更多 符合条件的调查单位,以此类推,样本如同滚雪球般由小变大,直 至达到要求的样本数为止。
⑤流动总体抽样。流动总体抽样是采用“捕获—放回—再捕获”的方式 来估计总体。
4.重点调查
重点调查也是一种非全面调查,是对数据收集对象总体 中的部分重点单位进行观测的统计调查方式。
频数(人) 频数(%)
30岁以下
39.3
30-40岁
37.9
40-50岁
统计学 第二章 统计调查

抽样调查
概念:是一种非全面调查,它从总体中抽 出部分单位组成样本,以样本推断总体 的调查方式。 根据抽取样本的方式不同分概率抽样和 非概率抽样。
优点:经济节省、时效性强、准确度高、 灵活方便。
作用:P29-30
1、用于认识不能或难以进行全面调查的总体数量特征。如无限 或范围很大的有限总体,以及破坏性产品的质量检验。 2、用于收集灵敏度高、时效性强或时间要求紧迫的统计数据。 如市场信息 3、用于不必进行全面调查的总体。(从经济效益考虑) 4、用于提高调查数据的质量(如与普查结合、重点调查结合) 5、用于对总体特征的某种假设检验,判断这种假设的真伪,支 持决策。
1953年的第一次人口普查,普查对象仅需填写5 个普查项目,到了1964年,普查项目增加到了9 项。改革开放后,普查项目继续大幅增加,1982 年19项,1990年21项,最近一次2000年人口普查, 长表所填项相比90年增加了38项,达到了59项。 普查项目的逐次增加,
• 五普普查表共分为:普查表短表、普查表长表、 死亡人口调查表和暂住人口调查表(附表)四 种表。 长表之于短表,在按户填报的部分增 加了关于调查对象生活情况的内容,而按人填 报的部分则增加了关于调查对象的学业完成情 况,迁移情况,经济活动情况,婚姻情况等许 多更加具体的内容。相比于前四次人口普查, 第五次人口普查不仅保证了中国人口的基本信 息如实汇总,而且加入了长表的抽样调查,这 样就可以获取更多更具有代表性的人口,经济 和社会数据,
• 单一表:“一户一表”。一张表格只列一个观测单位。问卷是其 特例。
一览表:“多户一表”。一张表格列多个观测单位。
问卷是一种特殊的调查表。
表头 表体 表脚
名称、编号、 制表单位、填 表日期等等
统计学第二章统计数据的收集、整理与显示习题

第二章统计数据的收集、整理与显示习题一、填空:1.统计数据收集是根据统计研究预定的目的和任务,运用科学的,有计划、有组织地反映客观现实的统计资料的过程。
2.搜集统计数据的方法有:(1)直接观察法,(2),(3)(4)。
3.统计调查按搜集资料的组织方式不同,可以分为普查、、、。
4.我国现行的统计调查体系是:以必要的周期性的普查为基础,经常性的为主体,同时辅之以、科学推算和部分全面报表综合运用的统计调查方法体系。
5.统计调查的方案一般包括如下几项内容:(1)明确调查目的,(2),(3)(4)(5)(6)(7)。
6.数据整理是对统计调查所搜集到的各种数据进行,或是对已有的综合统计资料进行再整理。
7.数据整理的程序包括:(1)统计资料的审核,(2),(3)或绘制统计图,(4)统计资料的积累、保管和公布。
8.根据统计研究的目的和客观现象的内在特点,按(或几个标志)把被研究的总体划分为若干个的组,称为统计分组。
9.统计分组,必须遵循两个原则:和。
10.统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为的那一组内,即所谓“上限在不内”原则。
11.统计分组必须先对所研究现象的作出全面、深刻的分析,确定所研究现象的属性及其内部差别,而后才能够选择出反映事物本质特征的分组标志。
二、单选题1.统计调查对象是()A.总体各单位标志值B.总体单位C.现象总体D.统计指标2.我国统计调查体系中,作为“主体”的是()A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算D.周期性普查3.要对某企业生产设备的实际生产能力进行调查,则该企业的“生产设备”是()A.调查对象B.调查单位C.调查项目D.报告单位4.对银行职工进行调查,调查对象是()A.所有银行B.银行所有职工C.每个银行D.银行每个职工5.全国人口普查中,总体单位是()A.每一个人B.每一个家庭C.每个银行D.银行每个职工6.报告单位亦称填报单位,它是()A.调查项目的承担者B.负责向上级报告调查内容的单位C.构成调查对象的每一个单位D.与调查单位相一致7.城镇家庭生活水平调查一般采用()A.重点调查B.典型调查C.普查D.抽样调查8.在统计资料的整理工作中,对原始资料的审核,重点是审核原始资料的()A.资料的准确性与完整性B.资料的完整性与代表性C.资料的准确性与及时性D.资料的准确性与全面性9.按某一标志分组的结果表现为()A.组内同质性、组间同质性B.组内同质性、组间差异性C.组内差异性、组间同质性D.组内差异性、组间差异性10.在统计分组时,若某个标志值刚好等于相邻两组上下限数值时()A.将此数值归入上限所在组B.将此数值归入下限所在组C.归入这两组中任意一组均可D.另设一组,归入其中11.在变量数列中,频率是指()A.各组分布次数相互之比B.各组的比率相互之比C.各组单位数与总体单位数之比D.各组的单位数12.当某一总体内最大变量值与最小变量值一定时,意味着()A.组距一定B.组数一定C.全距一定D.组限一定13.把保定市所有商店按商品销售额分组()A.只能进行单项式分组B.只能进行组距式分组C.既可以进行单项式分组,也可以进行组距式分组D.无法进行分组14. 统计表的构成,从形式上看包括()A.总标题和数字资料B.主词和宾词C.总标题、横行和纵栏标题三部分D.总标题、横行标题、纵栏标题和指标数值15. 统计表的构成,从内容上看,包括()A.总标题和指标数值B.主词和宾词C.总标题、横行和纵栏标题三部分D.总标题、横行标题、纵栏标题和指标数值16.编制单项数列,作为分组依据的变量是:甲、离散型变量;乙、连续型变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可编辑ppt
7
2.2 统计调查方案
• 一、调查目的和任务 • 二、调查对象、调查单位和报告单位 • 三、调查项目和调查表(调查问卷) • 四、调查时间和调查方法 • 五、调查工作的组织计划
可编辑ppt
8
二、调查对象、调查单位和报告单位
1、调查对象:调查的总体。 2、调查单位:调查的总体单位,所登记标志的承担者
直线式,序列式。
可编辑ppt
10
四、调查时间和调查方法
1、调查时间:调查数据所属时间,调查登记时间, 调查期限。
2、调查方法
可编辑ppt
11
五、调查工作的组织计划
1、组织机构和办事机构; 2、调查队的建立和组织培训; 3、调查经费的预算与开支办法; 4、试点调查; 5、正式实施。
可编辑ppt
12
2、特点:经济性、时 效性、适应性、准 确性、科学性。
☺ ☺
☺ ☺☺
☺☺
总体
随机样本
☺☺
可编辑ppt
19
• 1994年,为了适应社会主义市场经济的需 要,经国务院审批,全国统计工作会议提 出建立“以周期性普查为基础,以经常性抽 样调查为主体,同时辅之以重点调查、科 学推算等方法综合运用的统计调查方法体 系。
。 3、报告单位(填报单位):调查资料的上报单位。
可编辑ppt
9
三、调查项目和调查表(调查问卷)
1、调查项目:调查的具体内容。 例,如人口普查的调查项目包括姓名,性别,年 龄,民族,文化程度,职业,行业,婚姻等26个。
2、调查项目拟定原则:少而精;明确易懂;有答案。 3、调查问卷:列出调查项目的表格,包括单一表和一览表。 (1)调查问卷的结构:封面信,指导语,问题与答案,编码。 (2)调查问卷提问的格式:填空式,二项式,多项式,矩阵式,
第 2章 统计数据的搜集
• 2.1 统计调查概述 • 2.2 统计调查方案 • 2.3 统计调查的组织方式
可编辑ppt
1
2.1 统计调查概述
• 统计数据的来源 • 统计调查的含义、意义和要求 • 统计调查的分类
可编辑ppt
2
一、统计数据的来源
1、直接来源 (1)统计调查:指根据统计研究的目的和要求,
1、含义:为特定目的专门组织的非经常性全面调查。 2、意义:掌握国家基本国情国力。 3、办法:专门普查机构;原始记录和核算资料。
总体
可编辑ppt
15
二、统计报表
1、含义:按照国家制定的统一表式、统一指标、统一报送时间和报送程 序,自下而上逐级报送统计资料的一种调查方式。
2、资料来源:基层单位的原始记录或统计台账。 统一性是统计报表的基本特点。具体表现为: (1)统计报表的内容和报送的时间是由国家强制规定的,以保证调查资
利用科学的调查方法,有组织地向社会实际搜 集统计数据的工作过程。 (2)科学试验
可编辑ppt
3
2、间接来源
(1)统计部门和政府部门公布的有关资料, 如各类统计年鉴;
(2)各类经济信息中心、信息咨询机构、 专业调查机构等提供的数据;
(3)各类专业期刊、报纸、书籍所提供的资料; (4)各种会议,如博览会、展销会、交易会及
料的统一性。 (2)统计报表的指标含义,计算方法、口径是全国统一的。 4、特点:来源可靠,回收率高,方式灵活
可编辑ppt
16
三、重点调查
1、重点单位:在总体中数目不多,但其标志值在总 体标志值总量中占很大比重,且能反映总体基本情 况。
2、重点调查:仅对重点单位所进行的非全面调查。 3、特点:省时省力。
可编辑ppt
20
2.4 数据的误差
数据的误差
抽样误差 非抽样误差
抽样框误差 回答误差 无回答误差 调查员误差
可编辑ppt
21
抽样误差(sampling error)
1. 原因:抽样的随机性。 2. 含义:所有样本可能的结果与总体真值之间的
平均性差异 3. 影响抽样误差大小的因素:
– 样本量的大小 – 总体的变异性
可编辑ppt
17
四、典型调查
1、含义:在调查对象中选取若干具有典型意义或 代表性的单位所进行的非全面调查。
2、特点:灵活机动,省时省力。
可编辑ppt
18
五、抽样调查(sampling survey)
1、含义:从总体中随机抽取一部分单位作 为样本进行调查,并根据样本调查结果来 推断总体特征的数据搜集方法。
2. 非抽样误差的控制:
– 调查员的挑选;
– 调查员的培训;
– 督导员的调查专业水平;
– 调查过程控制
• 调查结果进行检验、评估;
• 现场调查人员进行奖惩的制度。
可编辑ppt
24
作业
• 登录下面网站: • 中国健康和营养调查(CHNS) • 中国综合社会调查(CGSS) • 要求: • 了解两项调查目的、内容和实施过程,比
1、意义:统计工作的首要环节,统计数据的源头。 (1)人们认识社会的基本方式; (2)统计工作的基础环节; (3)统计研究的重要部分。 2、要求:客观性、准确性、及时性、完整性。
可编辑ppt
6
三、统计调查的分类
1、按组织方式:统计报表、专门调查。 2、按调查范围:全面调查、非全面调查。 3、按调查时间:经常性调查、一次性调查。 4、按搜集方法:直接观察法、采访法、报告法、
可编辑ppt
22
非抽样误差(non-sampling error)
1. 含义:除抽样误差之外的、由于其他原因造成 的样本观察结果与总体真值之间的差异。
2. 特点:存在于所有的调查之中。 3. 类型:抽样框误差、回答误差、无回答误差、
调查员误差、测量误差。
可编辑ppt
23
误差的控制
1. 抽样误差的控制:增加样本容量。
(3)答;
问题表述清楚;
文字浅显易懂,简明扼要;
避免禁忌和敏感问题;
问题顺序排列恰当;
限定式问题的答案有穷尽性和互斥性
可编辑ppt
13
。
2.3 统计调查的组织方式
• 统计报表
• 普查
• 重点调查
• 典型调查
• 抽样调查
可编辑ppt
14
一、普查(census)
专业性、学术性研讨会上交流的有关资料; (5)从互联网或图书馆查阅到的相关资料。
可编辑ppt
Internet
http//WWW.
中 国中 人国 口市 统场 计统 年计 鉴年
鉴
4
• 3、一手数据与二手数据 • 一手数据:费时费力,相关性强; • 二手数据:经济方便,相关性不够。
可编辑ppt
5
二、统计调查的意义和要求