《统计学》第二章统计数据的搜集、整理1
合集下载
第2章统计数据的搜集与整理精品PPT课件

▪ 优点:应用范围广、结果正确、直接
▪ 缺点:成本高、研究时间长。
统计学
2-15
统计调查的组织方式
►统计报表
▪ 依据国家统计局或国家各行政管理的规定,自上而下 地统一布置,以一定的原始记录为依据,按照统一的 表式、指标、时间和程序自下而上地逐级提供基本统 计资料的调查方式。
►专门调查
▪ 普查
▪ 抽样调查
▪ 重点调查
►重点单位是指在全体中虽然数目不多,所占比不 大,但调查标志值却占较大比重。
▪ 典型调查
►有意识地选择有典型意义或具有代表性的单位。
统计学
2-16
统计报表
►是我国定期搜集基本统计资料的一种重要形式。 ►特点
▪ 来源于基层单位的原始记录 ▪ 项目稳定,有利于资料积累和动态比较
►种类
▪ 国家、部门和地方统计报表 ▪ 全面统计报表和非全面统计报表 ▪ 定期报表和年报 ▪ 基层表表和综合报表 ▪ 电讯报表和书面报表
►统计调查方法
▪ 现场观察法、报告法、问卷法、访谈法、实验 采集法等。
►统计调查的组织方式
▪ 统计报表 ▪ 专门调查
统计学
2-12
抽样调查方案
►确定调查目的(为什么调查) ►确定调查对象和调查单位
▪ 有许多性质相同的调查单位组成的现象总体。 ▪ 调查单位:所要研究的个体。
►确定调查项目:调查中所要调查单位的特征。 ►设计调查表与问卷设计 ►选择调查方法 ►确定调查时间和调查期限 ►制定调查的组织实施计划
统计学
2-13
统计调查方法
► 现场观察法
▪ 带有明确的目的到现场,直接观察获得数据信息。 ▪ 优点:准确;缺点:成本大
► 报告法(通讯法)
统计学第2章 统计数据的搜集、整理和显示

第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
大学统计学 第2章 统计数据的搜集、整理与显示

人。 性别构成 中国当前的人口性别比为106.74,男性占总人口
的51.63%;女性占总人口的48.37%。
8
2.抽样调查
抽样调查:是按随机原则从调查对象中抽取一部分 单位作为样本进行观察,然后根据样本数据去推算 调查对象的总体特征。
概率抽样的特点: 〈一〉样本单位按随机原则抽取,排除了主观因素对
27
1)排队: 2)求全距R=108-34=74 3)确定组数:
m 1 3 .3 lN g 1 3 .3 l4 g 6 0 .32
m取整为7
4)求组距: hR7410.57
h取整为10
m7
5)确定组限及次数(最终结果)
28
按日产量分组
30~40 40~50 50~60 60~70 70~80 80~90 90~100 100~110 合计
总体按某标志所分的组,若总体按数量标志分组, 分组标志在各组有不同的数量表现,形成标志值 数列,亦称变量,一般用x 表示;
各组所出现的单位数,即频数,亦称次数,用f 表示。
22
(3)相关的概念:
①频率
频率 fi fi
②频率的性质
(A)
0
fi fi
1
;
(B)
fi fi 1 。
③频数密度与频率密度: (A)频数密度=频数/组距 (B)频率密度=频率/组距
7
中国的人口总量 大陆2000年第五次人口普查结果现有人口数的
126583万; 香港特别行政区政府于2000年6月30日公布的香
港现有人口数为678万; 澳门特别行政区政府于2000年9月30日公布的澳
门现有人口数为44万; 台湾当局于2000年12月公布的中国台湾省和金门、
马祖等岛屿的人口数为2228万; 所以,2000年年底中国的人口总量应是129533万
的51.63%;女性占总人口的48.37%。
8
2.抽样调查
抽样调查:是按随机原则从调查对象中抽取一部分 单位作为样本进行观察,然后根据样本数据去推算 调查对象的总体特征。
概率抽样的特点: 〈一〉样本单位按随机原则抽取,排除了主观因素对
27
1)排队: 2)求全距R=108-34=74 3)确定组数:
m 1 3 .3 lN g 1 3 .3 l4 g 6 0 .32
m取整为7
4)求组距: hR7410.57
h取整为10
m7
5)确定组限及次数(最终结果)
28
按日产量分组
30~40 40~50 50~60 60~70 70~80 80~90 90~100 100~110 合计
总体按某标志所分的组,若总体按数量标志分组, 分组标志在各组有不同的数量表现,形成标志值 数列,亦称变量,一般用x 表示;
各组所出现的单位数,即频数,亦称次数,用f 表示。
22
(3)相关的概念:
①频率
频率 fi fi
②频率的性质
(A)
0
fi fi
1
;
(B)
fi fi 1 。
③频数密度与频率密度: (A)频数密度=频数/组距 (B)频率密度=频率/组距
7
中国的人口总量 大陆2000年第五次人口普查结果现有人口数的
126583万; 香港特别行政区政府于2000年6月30日公布的香
港现有人口数为678万; 澳门特别行政区政府于2000年9月30日公布的澳
门现有人口数为44万; 台湾当局于2000年12月公布的中国台湾省和金门、
马祖等岛屿的人口数为2228万; 所以,2000年年底中国的人口总量应是129533万
统计数据的收集与整理资料重点

第一次人口普查: 1953年6月,普查项目有:与户主关系、姓名、性别、 年龄、民族,以及本住址等6项。目的:为准备全国及地方人大会选举,做 好选民登记工作,并为国家的经济、文化建设提供确实的人口数字。
第二次人口普查: 1964年6月,普查项目有:除保留第一次普查的六个 项目外,新增了文化程度、本人成分、职业三项。目的是为了制定第三个 五年计划(1966-1970年)和长远规划提供依据。
缺点:访谈成本大,匿名性差,访谈结果与访 谈人员的素质、能力及其现场表现直接相关。 (五)实验采集法
优点:可以取得较为正确的原始资料; 缺点:成本高、研究时间长。
四、统计调查方案的设计
(一)确定调查目的 (二)确定调查对象和调查单位 (三)确定调查项目 (四)确定调查时间 (五)制定调查的组织实施计划 (六)选择调查方法
6.尊重隐私权。有利于客观性原则实现。
二、统计调查种类
统计调查可以从不同角度进行分类。 •(一)统计报表制度和专门调查 •(二)全面调查和非全面调查 •(三)经常性调查和一次性调查
三、统计调查方法
(一)直接观察法 优点:能够保证所收集资料的准确性; 缺点:观察成本较大(耗用人力、物力、财力、
时间等较大),由于观察者认识事物的能力不同,并带 有主观见解,其结果往往因人而异。 (二)报告法
第二章 统计数据的搜集
第一节 统计数据搜集的基本问题
1. 统计数据搜集的概念 – 根据统计研究预定的目的和任务,运 用科学的方法与手段,有计划、有组 织地向客观实际采集数据的过程。
2. 统计数据来源: – 原始资料(第一手资料); – 次级资料(第二手资料)
数据分类
原始 资料
数 据
次级 资料
1、统计调查 2、科学试验
统计学2. 数据的收集与整理

1.统计年鉴:《中国统计年鉴》、《国际统计年鉴》、地方
统计年鉴、《中国县(市)社会经济统计年鉴》、《中国金 融年鉴》、《中国人口和就业统计年鉴》、《中国统计摘要 》……
2.外文出版物:世界银行各年度的《世界发展报告》、联合
第一节 统计数据的搜集
三、统计调查的各种形式: 统计调查的形式:指统计调查的组织形式,
即组织统计调查,搜集信息资料的方式。
普查、统计报表制度、抽样调查、重点调查和 典型调查。
核心在于如何选取调查对象。
统计调查方法:获取数据的方法。
直接观测法、报告法(通讯法)、采访法、登记法、 电话访问法、网络调查法、试验设计法。
3. 调查项目一经确定,不能随意改变或增减,以免影响 汇总总和,降低资料质量。
普查的组织形式:
专门组织普查机构并配普查人员直接登记(人口普查); 利用原始资料由调查单位自填表格(物资库存普查)
第一节 统计数据的搜集
三、统计调查的各种形式:2、统计报表制度:
统计报表是依照国家有关法规(《中华人民共和 国统计法》),自上而下的统一布置,以一定的 原始记录为依据,按照统一的表式,统一的指标 项目,统一的报送时间和报送程序,自下而上地 逐级地定期提供统计数据的一种调查方式。是搜集
三个基本特征:
① 按照随机的原则抽取单位,排除个人主观意图的 影响;
② 对一部分单位(样本)做深入细致的调查研究, 取得数据,并据此从数量上推断总体。
③ 抽样误差可以事先计算并加以控制。
第一节 统计数据的搜集
三、统计调查的各种形式: 3、抽样调查: 适用范围:
① 不可能或很难进行全面调查的现象,必须采取抽样调查 方法。如产品寿命等;
核心在于如何获取数据。
统计年鉴、《中国县(市)社会经济统计年鉴》、《中国金 融年鉴》、《中国人口和就业统计年鉴》、《中国统计摘要 》……
2.外文出版物:世界银行各年度的《世界发展报告》、联合
第一节 统计数据的搜集
三、统计调查的各种形式: 统计调查的形式:指统计调查的组织形式,
即组织统计调查,搜集信息资料的方式。
普查、统计报表制度、抽样调查、重点调查和 典型调查。
核心在于如何选取调查对象。
统计调查方法:获取数据的方法。
直接观测法、报告法(通讯法)、采访法、登记法、 电话访问法、网络调查法、试验设计法。
3. 调查项目一经确定,不能随意改变或增减,以免影响 汇总总和,降低资料质量。
普查的组织形式:
专门组织普查机构并配普查人员直接登记(人口普查); 利用原始资料由调查单位自填表格(物资库存普查)
第一节 统计数据的搜集
三、统计调查的各种形式:2、统计报表制度:
统计报表是依照国家有关法规(《中华人民共和 国统计法》),自上而下的统一布置,以一定的 原始记录为依据,按照统一的表式,统一的指标 项目,统一的报送时间和报送程序,自下而上地 逐级地定期提供统计数据的一种调查方式。是搜集
三个基本特征:
① 按照随机的原则抽取单位,排除个人主观意图的 影响;
② 对一部分单位(样本)做深入细致的调查研究, 取得数据,并据此从数量上推断总体。
③ 抽样误差可以事先计算并加以控制。
第一节 统计数据的搜集
三、统计调查的各种形式: 3、抽样调查: 适用范围:
① 不可能或很难进行全面调查的现象,必须采取抽样调查 方法。如产品寿命等;
核心在于如何获取数据。
统计学:第2章 数据的搜集、整理与显示

2-7
统计学
(第二版)
统计应用引例 1
Good Tunes 是一家通过互联网做电子商 务的厂商,主要销售高品质的音响设备,
它试图向顾客提供更优质的服务和更高 品质的商品.为了了解顾客的看法, Good Tunes 请它的顾客填写并迅速 寄回一张顾客满意度调查问卷.这张问 卷包含了以下几个问题:
2-8
2-3
统计学
(第二版)
§2.1 数据的来源
一. 数据的直接来源和间接来源
直接来源 通过自己调查或实验活动,直接获得 的第一手数据
间接来源 由别人通过调查或实验的方式收集的
二.为什么需要数据
三.统计数据的质量
2-4
统计学
(第二版)
一 .数据的来源
1. 政府、行业或个人已发布或出版了各种数据
2. 可以设计一个实验来获得必要的数据 (洗涤剂去污力。更多为自然现象,如农作物等)
2 - 22
统计学
(第二版)
二、搜集数据的基本方法
1、询问调查法
调查对象一定是人 适合调查主观问题 质量取决回答的意愿和真实
2、观察法
调查对象一般是客观现象 数据准确 需要大量人力和时间
3、实验法
调查人员搜集数据是积极主动的参与者
2 - 23
统计学
(第二版)
1. 询问调查法
调查者和被调查者直接或间接的接触获得数据。 (1)访问调查(如街上拦截法)
重点单位: 指在所要调查的数量特征上占有较大比 重的单位, 这部分单位在总体单位数目中只是很小的 比重
如:某邮电企业有特快专递用户10万户,但其中有100个用 户的特快专递业务量占该邮局特快专递业务量的80%,这 100个用户就是调查特快专递业务量及需求量的重点单位
统计学
(第二版)
统计应用引例 1
Good Tunes 是一家通过互联网做电子商 务的厂商,主要销售高品质的音响设备,
它试图向顾客提供更优质的服务和更高 品质的商品.为了了解顾客的看法, Good Tunes 请它的顾客填写并迅速 寄回一张顾客满意度调查问卷.这张问 卷包含了以下几个问题:
2-8
2-3
统计学
(第二版)
§2.1 数据的来源
一. 数据的直接来源和间接来源
直接来源 通过自己调查或实验活动,直接获得 的第一手数据
间接来源 由别人通过调查或实验的方式收集的
二.为什么需要数据
三.统计数据的质量
2-4
统计学
(第二版)
一 .数据的来源
1. 政府、行业或个人已发布或出版了各种数据
2. 可以设计一个实验来获得必要的数据 (洗涤剂去污力。更多为自然现象,如农作物等)
2 - 22
统计学
(第二版)
二、搜集数据的基本方法
1、询问调查法
调查对象一定是人 适合调查主观问题 质量取决回答的意愿和真实
2、观察法
调查对象一般是客观现象 数据准确 需要大量人力和时间
3、实验法
调查人员搜集数据是积极主动的参与者
2 - 23
统计学
(第二版)
1. 询问调查法
调查者和被调查者直接或间接的接触获得数据。 (1)访问调查(如街上拦截法)
重点单位: 指在所要调查的数量特征上占有较大比 重的单位, 这部分单位在总体单位数目中只是很小的 比重
如:某邮电企业有特快专递用户10万户,但其中有100个用 户的特快专递业务量占该邮局特快专递业务量的80%,这 100个用户就是调查特快专递业务量及需求量的重点单位
统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
frequency distribution 2.分布数列的两个要素
1)总体按某标志x所分的组。 2)各组所出现的单位数,即频 数f,亦称次数。
二、变量数列的编制
1.编制方法(P36,例2-1)。 2.频率的性质
1)频率是界于0和1之间的一个分 数,
2)各组频率之和等于1。 3.(异距分组)频数密度: 频数密度=频数/组距 频率密度=频率/组距
组的组距。上
组中值 =
限
下
限
2
6)组数的计算: 组数=全距/组距 斯特杰斯Sturges经验公式(P31): 组数=1+3.3 Lg N 由此推出,组距=(最大变量值-最小 变量值)/(1+3.3Lg N )
三、统计指标Index, Indicator
(一)指标的定义 描述总体的数量特征。标志是描述个体 的。
2.专门调查是为某一专题研究而组织 的专项调查。
三、统计调查体系
建立以必要的周期性的普查为基础, 经常性的抽样调查为主体,同时辅之 以重点调查、科学推算和少量的全面 报表综合运用的统计调查方法体系。
四、统计调查误差error
第二节 数据整理
一、数据整理的内容与程序
1.统计数据整理的内容: 统计分组和统计指标是统计整理的中心 工作。 2.数据整理的程序。
(二)统计分组的方法
1.品质分组的方法 2.数量分组的方法 1)应注意的问题: A)分组时各组数量界限的确定必须能反 映事物质的差别。
B)应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。
2)单项式分组与组距式分组 A)单项式分组 B)组距式分组:
连续型变量或者变动范围较大的离散型 变量,适宜采用组距式分组。
第二,它是一种全面调查,可获得大 量详细、全面的资料。
例如,人口普查,经济普查
2)全面统计报表制度
statistical yearbook A) 定义 :自上而下…自下而上… B)统计报表的主要特点: 第一,资料来源于各个基层单位的原始 记录。
第二,逐级上报和汇总的。
第三,属于经常性(连续性)调查,调 查项目相对稳定,有利于积累资料,并 进行动态对比分析。
二、统计调查的组织形式
(一)全面调查与非全面调查
1.全面调查是对调查对象的所有单位 一一进行调查。
1)普查census 普查是专门组织的一种全面调查,它 主要是用以调查某些不能或不宜用定 期的全面报表搜集的统计资料。
普查的主要特点:
第一,它是一次性(非连续性)的调 查,一般间隔较长时间。
第三,抽样误差可以事先计算并加以控制。
B)适用范围: 第一,不可能或不必要进行全面调 查的社会现象。例如,破坏性的产 品质量检在调查对象中,只选 择一部分重点单位进行的非全面调查。
3)典型调查 典型调查是一种专门组织的非全面调 查。根据调查的目的,在对所研究的 对象进行初步分析的基础上,有意识 地选取若干具有代表性的单位进行调 查和研究,借以认识事物发展变化的 规律。
(二)指标的分类 1.数量指标:GDP 2.质量指标: CPI,Engel coefficient系 数
(三)指标体系 (四)国民经济活动的主要统计指标
多选题
1,学龄前儿童按年龄分组为:未满1 岁,1-2岁,3-6岁。这里( ) A年龄是分组标志 B年龄是离散型变量 C儿童是分组标志 D第一组的组中值是0.5岁 E第二组的组中值是1.5岁
3)间断组距式分组和连续组距式分组 主要概念:下限和上限、组距、组限 间断组距式分组:组限不相连的组距式 分组
连续组距式分组:组限相连(或称相 重叠的),即以同一数值作为相邻两 组的共同界限的组距式分组。
“上限在不内”原则:在连续组距式 分组中,以同一个数值作为相邻两组 共同的界限,我国统计制度规定,凡 是总体某一个单位的变量值是相邻两 组的界限值,这一个单位归入作为下 限值的那一组内。 (六十分万岁!)
三、cumulative累计频数与累计频率 1.向上累计频数(或频率)分布:先 列出各组的上限,然后由标志值低的 组向标志值高的组依次累计。
(二)连续性调查与非连续性调 查
统计调查按时间标志可分为连续性(经 常性)和不连续性(一次性)调查两大 类。
1.连续性(经常性)调查:是指随着研 究现象的变化,连续不断地进行调查登 记。
2.不连续性(一次性)调查:是指间隔 一段较长的时间对事物的变化进行一次 性调查。
( 三)定期报表形式与专门调查 1.定期报表制度是按国家统一规定的表 式和内容,定期地向各级领导机构报送 统计资料的一种调查形式。
4)等距分组与异距分组
等距分组:标志值在各组保持相等的 组距,即各组的标志值变动都限于相 同的范围。
异距分组:各组的组距不相等。
5)组距与组中值的计算
连续式分组的组距计算公式:
distance组距=本组上限–本组下限
间断式分组的组距计算公式:
组距=本组上限–本组下限+1
开口组的组距:以相邻组的组距为本
2,以下哪些是相对指标( ) A生猪出栏率 B恩格尔系数 C企业劳动生产率 D股票平均价格 E人口增长率
3,在第五次全国人口普查中,( ) A国籍是可变标志 B全国人口数是统计指标 C每个中国公民是调查对象 D人口年龄是变量 E全国女性人数是品质标志
第三节 频数分布
一、频数分布的基本概念
1.频数分布
2.非全面调查:对调查对象其中的一部分单 位进行调查。
1 ) 抽 样 调 查 sampling , 是 从 调 查 对 象 中 抽 取一部分单位作为样本进行观察,然后根据 所获得的样本数据,对调查对象总体特征作 出具有一定可靠程度的推算或对总体进行了 解。
A)特点:
第一,按随机原则抽取样本。
第二,根据部分调查的实际资料对调查对象 总体的数量特征作出估计(统计推断)。
二、统计分组
(一)统计分组的概念与种类
1.统计分组的概念 组内一致性,组间差异性 2.统计分组的原则
穷尽原则:不漏 互斥原则:不重
3.统计分组的种类
1)按分组标志的多少,可分为简单 分组和复合分组。
2)按分组的标志的性质不同,分为 品质分组(或称属性分组)和数量分 组(或称变量分组)。
3)按分组的作用和任务不同,分为 类型分组、结构分组和分析分组。
1)总体按某标志x所分的组。 2)各组所出现的单位数,即频 数f,亦称次数。
二、变量数列的编制
1.编制方法(P36,例2-1)。 2.频率的性质
1)频率是界于0和1之间的一个分 数,
2)各组频率之和等于1。 3.(异距分组)频数密度: 频数密度=频数/组距 频率密度=频率/组距
组的组距。上
组中值 =
限
下
限
2
6)组数的计算: 组数=全距/组距 斯特杰斯Sturges经验公式(P31): 组数=1+3.3 Lg N 由此推出,组距=(最大变量值-最小 变量值)/(1+3.3Lg N )
三、统计指标Index, Indicator
(一)指标的定义 描述总体的数量特征。标志是描述个体 的。
2.专门调查是为某一专题研究而组织 的专项调查。
三、统计调查体系
建立以必要的周期性的普查为基础, 经常性的抽样调查为主体,同时辅之 以重点调查、科学推算和少量的全面 报表综合运用的统计调查方法体系。
四、统计调查误差error
第二节 数据整理
一、数据整理的内容与程序
1.统计数据整理的内容: 统计分组和统计指标是统计整理的中心 工作。 2.数据整理的程序。
(二)统计分组的方法
1.品质分组的方法 2.数量分组的方法 1)应注意的问题: A)分组时各组数量界限的确定必须能反 映事物质的差别。
B)应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。
2)单项式分组与组距式分组 A)单项式分组 B)组距式分组:
连续型变量或者变动范围较大的离散型 变量,适宜采用组距式分组。
第二,它是一种全面调查,可获得大 量详细、全面的资料。
例如,人口普查,经济普查
2)全面统计报表制度
statistical yearbook A) 定义 :自上而下…自下而上… B)统计报表的主要特点: 第一,资料来源于各个基层单位的原始 记录。
第二,逐级上报和汇总的。
第三,属于经常性(连续性)调查,调 查项目相对稳定,有利于积累资料,并 进行动态对比分析。
二、统计调查的组织形式
(一)全面调查与非全面调查
1.全面调查是对调查对象的所有单位 一一进行调查。
1)普查census 普查是专门组织的一种全面调查,它 主要是用以调查某些不能或不宜用定 期的全面报表搜集的统计资料。
普查的主要特点:
第一,它是一次性(非连续性)的调 查,一般间隔较长时间。
第三,抽样误差可以事先计算并加以控制。
B)适用范围: 第一,不可能或不必要进行全面调 查的社会现象。例如,破坏性的产 品质量检在调查对象中,只选 择一部分重点单位进行的非全面调查。
3)典型调查 典型调查是一种专门组织的非全面调 查。根据调查的目的,在对所研究的 对象进行初步分析的基础上,有意识 地选取若干具有代表性的单位进行调 查和研究,借以认识事物发展变化的 规律。
(二)指标的分类 1.数量指标:GDP 2.质量指标: CPI,Engel coefficient系 数
(三)指标体系 (四)国民经济活动的主要统计指标
多选题
1,学龄前儿童按年龄分组为:未满1 岁,1-2岁,3-6岁。这里( ) A年龄是分组标志 B年龄是离散型变量 C儿童是分组标志 D第一组的组中值是0.5岁 E第二组的组中值是1.5岁
3)间断组距式分组和连续组距式分组 主要概念:下限和上限、组距、组限 间断组距式分组:组限不相连的组距式 分组
连续组距式分组:组限相连(或称相 重叠的),即以同一数值作为相邻两 组的共同界限的组距式分组。
“上限在不内”原则:在连续组距式 分组中,以同一个数值作为相邻两组 共同的界限,我国统计制度规定,凡 是总体某一个单位的变量值是相邻两 组的界限值,这一个单位归入作为下 限值的那一组内。 (六十分万岁!)
三、cumulative累计频数与累计频率 1.向上累计频数(或频率)分布:先 列出各组的上限,然后由标志值低的 组向标志值高的组依次累计。
(二)连续性调查与非连续性调 查
统计调查按时间标志可分为连续性(经 常性)和不连续性(一次性)调查两大 类。
1.连续性(经常性)调查:是指随着研 究现象的变化,连续不断地进行调查登 记。
2.不连续性(一次性)调查:是指间隔 一段较长的时间对事物的变化进行一次 性调查。
( 三)定期报表形式与专门调查 1.定期报表制度是按国家统一规定的表 式和内容,定期地向各级领导机构报送 统计资料的一种调查形式。
4)等距分组与异距分组
等距分组:标志值在各组保持相等的 组距,即各组的标志值变动都限于相 同的范围。
异距分组:各组的组距不相等。
5)组距与组中值的计算
连续式分组的组距计算公式:
distance组距=本组上限–本组下限
间断式分组的组距计算公式:
组距=本组上限–本组下限+1
开口组的组距:以相邻组的组距为本
2,以下哪些是相对指标( ) A生猪出栏率 B恩格尔系数 C企业劳动生产率 D股票平均价格 E人口增长率
3,在第五次全国人口普查中,( ) A国籍是可变标志 B全国人口数是统计指标 C每个中国公民是调查对象 D人口年龄是变量 E全国女性人数是品质标志
第三节 频数分布
一、频数分布的基本概念
1.频数分布
2.非全面调查:对调查对象其中的一部分单 位进行调查。
1 ) 抽 样 调 查 sampling , 是 从 调 查 对 象 中 抽 取一部分单位作为样本进行观察,然后根据 所获得的样本数据,对调查对象总体特征作 出具有一定可靠程度的推算或对总体进行了 解。
A)特点:
第一,按随机原则抽取样本。
第二,根据部分调查的实际资料对调查对象 总体的数量特征作出估计(统计推断)。
二、统计分组
(一)统计分组的概念与种类
1.统计分组的概念 组内一致性,组间差异性 2.统计分组的原则
穷尽原则:不漏 互斥原则:不重
3.统计分组的种类
1)按分组标志的多少,可分为简单 分组和复合分组。
2)按分组的标志的性质不同,分为 品质分组(或称属性分组)和数量分 组(或称变量分组)。
3)按分组的作用和任务不同,分为 类型分组、结构分组和分析分组。