第二章统计数据的收集与整理
合集下载
统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
第2章-统计数据的来源与整理(3学时)

70
60
50
40
30
20
10
横坐标代表广告投入, 而纵坐标代表销售收入。 看得出有何种关系吗?
0 2 4 6 8 10 12 14
额 销售
0
广告投入
定量变量间的关系
• • • • • • 能否从该数据回答下面问题: 这两个变量是否有关系? 如果有,它们的关系是否真实的(显著)? 这些关系是什么关系,能否用数学模型来描述? 这个关系是否带有普遍性? 这个关系是不是因果关系?
搜集数据的基本方法
调查的数据
实验的数据
自填式
面访式
电话式
自填式问卷调查
1. 没有调查员协助的情况下由被调查者自己完成 调查问卷
– 问卷递送方法有:调查员分发、邮寄、网络、媒体
• •
要求调查问卷结构严谨,有清楚的说明 弱点
– – – – 问卷的返回率比较低 不适合结构复杂的问卷 调查周期比较长 数据搜集过程中出现的问题难于及时采取调改措施
统计数据的来源与整理
第 2 章
§2.1 §2.2 §2.3 §2.4
数据的搜集与整理
数据案例 数据的计量与类型 统计数据的收集 统计数据的整理
数据案例
案例:证券交易数据
案例:成都市居民理财行为调查
• 提高居民的财产性收入成为经济发展 目标 • 成都居民理财情况具有代表性的 • 调研目的
–商业银行个人理财产品的市场定位 –制定提高居民财产性收入的政策
1. 对现象进行计量的结果 2. 不是指单个的数字,而是由多个数据构成 的数据集 3. 不仅仅是指数字,它可以是数字的,也可 以是文字的
统计数据的分类
• 统计数据的分类
• 按计量层次 • 按收集方法 • 按时间状况
管理统计学第二章统计数据的搜集与整理

定量变量 该地区的学生数量 另一类是无名数,无名数可以根据不同的情况分别采用倍数、成数、系数、百分数、千分数等来表示,如:人口出生率、死亡率等。
D.一家市场研究机构想要调查行人是否注意到新加坡的大片 在我国,公开出版或报道的社会经济统计数据主要来源是国家和地方的统计部门以及各种学报。 岛屿安装了新的交通信号灯系统(LED)。 无论采取何种方式进行调查,在取到需要的统计数据时,都有一些具体的数据搜集方法。 A.比例尺度 统计调查是取得社会经济数据的主要途径,也是直接获得第一手统计数据的重要手段。
教师的平均工资水平
学生的智商
(b) 该地区的学生数量
比例尺度
学校名称
无序分类尺度
每名学生花费的金额
比例尺度
教师的平均工资水平
比例尺度
学生的智商
间隔尺度
1.3 绝对数与相对数
• 绝对数: 反映客观现象总体在一定时间、地点条件 下的总规模、总水平的综合指标,表现为事物的绝 对水平的描述。如:一定总体范围内的粮食总产 量、农业总产值、国营企业数等。
【例2-1】判断下列变量的类型
• 邮局信件的重量 可以作加法、减法计算,但不可以作乘法计算。
• 连续定量变量
• 小轿车的牌子 • 定性变量 定量变量 该地区的学生数量
无论采取何种方式进行调查,在取到需要的统计数据时,都有一些具体的数据搜集方法。
• 镭射唱片总的播放时间 • 连续定量变量 管理统计学第二章统计数据的搜集与整理
。
• 比例尺度:由于也有测量单位,因此我们可以用数值之间 的差值来描述两个对象之间的差距。数值之间的比例有意 义,而且“零”这个数值有内在的含义。
– 不仅可以作加减运算,还可以作乘除运算。 – 例如,身高、重量和花费的时间就属于这一类。
D.一家市场研究机构想要调查行人是否注意到新加坡的大片 在我国,公开出版或报道的社会经济统计数据主要来源是国家和地方的统计部门以及各种学报。 岛屿安装了新的交通信号灯系统(LED)。 无论采取何种方式进行调查,在取到需要的统计数据时,都有一些具体的数据搜集方法。 A.比例尺度 统计调查是取得社会经济数据的主要途径,也是直接获得第一手统计数据的重要手段。
教师的平均工资水平
学生的智商
(b) 该地区的学生数量
比例尺度
学校名称
无序分类尺度
每名学生花费的金额
比例尺度
教师的平均工资水平
比例尺度
学生的智商
间隔尺度
1.3 绝对数与相对数
• 绝对数: 反映客观现象总体在一定时间、地点条件 下的总规模、总水平的综合指标,表现为事物的绝 对水平的描述。如:一定总体范围内的粮食总产 量、农业总产值、国营企业数等。
【例2-1】判断下列变量的类型
• 邮局信件的重量 可以作加法、减法计算,但不可以作乘法计算。
• 连续定量变量
• 小轿车的牌子 • 定性变量 定量变量 该地区的学生数量
无论采取何种方式进行调查,在取到需要的统计数据时,都有一些具体的数据搜集方法。
• 镭射唱片总的播放时间 • 连续定量变量 管理统计学第二章统计数据的搜集与整理
。
• 比例尺度:由于也有测量单位,因此我们可以用数值之间 的差值来描述两个对象之间的差距。数值之间的比例有意 义,而且“零”这个数值有内在的含义。
– 不仅可以作加减运算,还可以作乘除运算。 – 例如,身高、重量和花费的时间就属于这一类。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示

– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
统计调查统计数据的收集与整理ppt

-
22
(二)次级资料收集方法
次级资料又称二手资料,是指他人为了 自己的研究目的而调查、整理的资科。
1.根据研究项目的内容判别所需资料的类型 2.寻找资料的来源 3.对次级资料的查找 4.对查找的资料进行甄别、清理、补充
-
14
(4)统计报表(制度)
Statistical Report Forms 按照国家统一规定的表格形式,定期地、
自 上而下布置,自下而上填报统计资料的一种调 查形式。 特 点:已经形成一种制度;可以组织全面、非 全面调查。 类 型:国家统计报表、业务统计报表、地方统 计报表;
半月报、月报、季报、半年报、年报。 用 途:用于搜集全面的基本情况,也为重点调 查等非全面调查所采用。
统计学
Statistics
-
1
第二章 统计数据的收 集与整理
第一节 统计数据收集
-
2
一、收集资料的方式 概括起来分为直接方式和间接方式
(一)统计资料的直接收集
主要包括统计调查和试验设计
(二)统计资料的间接收集
通过各种渠道收集第二手资料
-
3
(一)统计资料的直接收集
1.统计调查
统计报表
按调查组织形式
数据的搜集方法
询问调查
观察实验
访邮电 问寄话 调调调 查查查
座个 谈别
深 会访
-
观
实
察
验
20
二、收集资料的方法
数据资料的收集方法可以分为初级资料收 集方法和次级资料收集方法或称文案资料。
(一)初级资料收集方法 ➢ 1.访问法
访问法是按所拟调查事项,有计划地通过访谈 询问方式向被调查者提出问题,通过他们的回答来 获得有关信息资料的方法。
统计学第二章统计调查

上一页 下一页
统计数据收集的种类
按收集对象的范围大小分为 按收集时间是否连续分为
按收集的组织形式分为
按收集的方式不同分为
实验方式 调查方式
非全面调查 全面调查
经常性调查 一次性调查 统计报表 专门调查
统计报表 普查
重点调查
抽样调查等
全面调查
调查 范围
统
非全面调查
计
调
调查
连续(经常性)调查
查 形
时间
• 时期现象:指标据反映的起止日期。 • 时点现象:就是规定的统一标准时点。 • 数据收集期限:完成数据收集工作的起止时间。
包括收集资料和报送资料整个工作所需时间。
数据 所属 时间 {客观 时间}
等于
数据 资料 所属 时间
数据 收集 期限 {主观 时间}
等于
数据 收集 工作 时间
起讫时间(一段时期内的数据)
统计报表过多会增加基层负担 有可能由于虚报瞒报而影响统计资料质量
单位
• 观测标志(项目):
• 是根据数据收集目的所确定。包括品质标志 和数量标志。
• 拟定数据收集项目应注意: • 1、观测标志必须是数据收集目的所需要的并
且是确实可取得资料的。 • 2、观测标志必须相互联系,便于统计分析和
核对资料的差错。 • 3、观测标志的含义必须明确,不能 有两个或
以上的解释。 • 4、观测标志的表达形式要明确。用文字还是
①方案设计
②搜集数据
③数据处理
④报告写作
⑤验收
注:6 月 30 日前完成方案设计,问卷的定稿印刷发放
7 月 25 日前完成问卷收回与审核,并制定数据处理方案(数据库框架)
ห้องสมุดไป่ตู้
统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
第2章 统计数据的收集整理与显示

A:您至今未买电脑的原因是什么?(单选不可以,多 选可以) (a)买不起(b)没有用(c)不懂(d)其它
(3) 无论多/单选题,任一个备选答案都不能有多 重含义。 A.您选择信息专业的目的是:
(a)自己喜欢,好就业(b)„„
(4) 无论多/单选题,备选答案之间不能有包含关 系。 A.您上大学的目的是:
例2.1 某车间50个工人看管机床台数资料如下:
3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 3 2 3 6 5 4 2 4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 5
试对数据进行分组。 解:由于机器台数属于离散型变量,因此使用单项式分 组方法。将原始资料按变量值升序排列,然后将相同变 量值分为一组,最后将资料分成若干组。
2.按数量标志分组 数值型数据:主要是按照数值进行分组。 例:对学生成绩分组,可分为60分以下、60~70分、 70~80分、80~90分、90分以上5个组。
单项式分组 按数量标志分组的方法: 组距式分组
单项式分组:把每一个变量值作为一组。 适用条件:通常只适于离散变量且变量值较少的情况
表2-2 变量编码表
NUM SEX JOB A11 A12 A13 A14 A15 A21 A22 A23 A24
001
002
1
1
1
210来自001
1
1
1
0
1
1
1
1
0
0
0
1
0
编码表说明:
NUM- 编码 SEX- 性别 jOB- 职务 A11~A15代表第一题中5个选项,选中者输入1, 未选中者输入0。 A21~A24代表第二题中4个选项,选中者输入1, 未选中者输入0。