第七章抽样调查技术
第七章 抽样调查技术

13
一、简单随机抽样
(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2015/12/22
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因
原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。
(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
统计学课件-第七章抽样调查

分层抽样特点
03
04
05
适用于总体内部差异较 大的情况,能够提高样 本的代表性。
可以根据各层的具体情 分层抽样能够降低抽样 况采用不同的抽样方法, 误差,提高估计的精度。 灵活性强。
分层标准选择与确定
选择分层标准的原则
各层之间具有明显的 区分度,避免出现重 复或遗漏。
与调查目的密切相关, 能够反映总体内部差 异的标志。
3
灵活性高,可以在不同阶段采用不同的抽样方法 和技术。
多阶段抽样优缺点分析
• 节约成本,减少调查人员和资源的需求。
多阶段抽样优缺点分析
抽样误差可能增加
01
由于多阶段抽样的复杂性,可能导致抽样误差的增加。
对抽样设计的要求较高
02
需要仔细设计和规划每个阶段的抽样方法和样本量分配,以确
保抽样的有效性和代表性。
抽样调查作用
抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料, 因而,也可起到全面调查的作用。
抽样方法与类型
抽样方法
简单随机抽样、系统抽样、分层抽样和整群抽样。
抽样类型
概率抽样和非概率抽样。
抽样误差与置信水平
抽样误差
是指由于随机抽样的偶然因素使样本各单位的结构不足以代 表总体各单位的结构,而引起抽样指标和全局指标的绝对离 差。
成本考虑
当总体差异较大时,简单随机抽样的 精度可能受到影响。
对于大规模调查,简单随机抽样可能 需要较高的成本。
实施难度
在某些情况下,获取完整的抽样框可 能较为困难。
03 分层抽样技术及应用
分层抽样原理及特点
01
02
分层抽样原理:将总体 按照某种特征或标志分 成若干层,然后从每一 层中随机抽取一定数量 的样本,最后将这些样 本合并起来构成总体的 样本。
抽样技术第七章整群抽样ppt课件

NM
NM
故有 可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc
sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式:
《抽样技术》第七章
1
第七章 整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
2
§7.1 概述
设总体由N个大单元,即初级单元组成,每个初级 单元又由若干个较小的次级单元或二级单元组成。 从总体中按某种方式抽取n个初级单元,观测其中所 包含的所有次级单元。这种抽样称为整群抽样。确 切地说,应称为单阶整群抽样。
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。
(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
统计学原理第七章 抽样调查

合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
《统计学原理》课件第七章抽样调查

第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
第三,在有明确总体单位的数字表中选出符合上 述数字的总体单位,这些总体单位就是样本。
2020/11/17
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2020/11/17
24
(一)分层抽样的具体步骤
第一步,辨明突出的(重要的)人口统计 特征和分类特征,这些特征与所研究的行 为相关。
第四,整群抽样也是多阶段抽样的前提和基础。
2020/11/17
34
五、多阶段抽样
(一)多阶段抽样的特点
第一,多阶段抽样对基本调查单位的抽选不是一 步到位的,至少要两步。
第二,组织调查比较方便,尤其对于那些基本单 位数多且分散的总体,由于编制抽样框较为困难 或难以直接抽取所需样本,就可以利用地理区域 或行政系统进行多阶段抽样。
2020/11/17
16
(四)简单随机抽样的优缺点
方法简单直观,当总体名单完整时,可直 接从中随机抽取样本,由于抽取概率相同 ,计算抽样误差及对总体指标加以推断比 较方便。
尽管简单随机抽样在理论上是最符合随机 原则的,但在实际应用中则有一定的局限 性。
Hale Waihona Puke 2020/11/1717
二、等距抽样
(一)等距抽样法的具体操作 (二)等距抽样的实施办法 (三)等距抽样的参数估计 (四)等距抽样的优缺点
20
(三)等距抽样的参数估计
1、估计量
1 n
ysy yi n j1 yij
2020/11/17
21
V ( ysy
)
N 1S N
2
K (n 1) N
S2 wsy
2.估计量的方差
V
( ysy )
N 1S2 N
K (n 1) N
S2 wsy
其中,
S2 wsy
1 K (n 1)
K i
n
( yij yi )2
一、简单随机抽样 二、等距抽样 三、分层抽样 四、整群抽样法 五、多阶段抽样
2020/11/17
12
一、简单随机抽样
(一)简单随机抽样的具体操作 (二)简单随机抽样平均误差 (三)简单随机抽样的方法 (四)简单随机抽样的优缺点
2020/11/17
13
一、简单随机抽样
(一)具体操作步骤:
整群 抽取 抽取 低于简单随机 缩小群间差异,增
抽样 部分 全部 抽样
大群内差异,增加
群数
二级 抽取 抽取 介于整群抽样 减少一级单元之间
j
为等距样本(群) 内方差
S 2 为总体方差。
2020/11/17
22
(四)等距抽样的优缺点
第一,运用等距抽样的前提是要有总体每 个单位的有关材料,特别是按有关标志排 队时,往往需要有较为详细、具体的相关 资料。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2020/11/17
27
(四)分层抽样的优点
分层抽样比简单随机抽样和等距抽样等方 法更为精确,能够通过对较少的抽样单位 的调查,得到比较准确的推断结果,特别 是当总体较大、内部结构复杂时,分层抽 样常能取得令人满意的效果。同时,分层 抽样在对总体推断的同时,还能获得对每 层的推断。
2020/11/17
2020/11/17
33
(三)整群抽样需注意的几个问题
第一,整群抽样的随机性体现在群与群之间不重叠, 总体的任何一个基本单位都必须且只能归于某一群, 群的抽选按概率确定。
第二,如果把每一个群看成一个单位,那么,整群抽 样就是以群为单位的纯随机抽样。
第三,整群抽样对于群而言是非全面调查,对于被抽 中群内基本单位而言则是全面调查,是“先部分,后 全部”的抽样组织形式,与分层抽样正好相反。
类别
各自特点
共同点
抽样间的联系 适用范围
简单随机 抽样 等距抽样
分层抽样
从总体中逐个抽 (1)抽样过
取
程中每个个
体被抽到的
将总体均分成几 可能性相等 在起始部分时
部分,按预先制 (2)每次抽 采用简单随机
定的规则在各部 出个体后不 抽样
分抽取
再将它放回,
即不放回抽
样 将总体分成几层,
分层抽样时采
分层进行抽取
(4)复合连接是指抽样框单元与目标总体单元不完全一一 对应,而是存在一对多、多对一或多对多模式的现象。
(5)不正确的辅助信息误差也被称为“内容上的偏差”, 这种误差会降低估计的精度。
(6)抽样框老化又被称为“抽样框过时”或“不准确的抽 样框”。
2020/11/17
10
3.减少抽样框误差的方法
(1)在抽选样本之前,要对抽样框加以检查,发 现可能存在的问题,进行识别、处理,并采取一 定措施加以补救。
分类:
全及总体可以根据单位数量是否有限,分为无限 全及总体(infinite population)和有限全及总体 (finite population)。
2020/11/17
5
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子
样”、“样本”,是指从全及总体中抽取出来的 单位集合。
2020/11/17
8
(二)抽样框误差
1.抽样框误差的概念 抽样框误差(sampling frame error)是因不
准确或不完整的抽样框而引起的误差。抽 样框误差是一种非抽样误差
2020/11/17
9
2.抽样框误差的形成
(1)丢失目标总体单位也被称为“涵盖不足”,是指抽 样框没有覆盖全部目标总体单位。 (2)包含非目标单位也被称为“过涵盖”,是指抽样框 中包含了一些不属于研究对象的非目标总体单位。 (3)丢失目标单位和非目标单位共存,是指在抽样框中 既有丢失目标单位,也有包含非目标单位。
第七章:抽样调查技术
本章教学目的 第一节 抽样调查的基本概念 第二节 概率抽样设计 第三节 非概率抽样 第四节 样本容量的确定
2020/11/17
1
本章教学目的
通过本章学习,了解抽样调查的各项 技术的特点,正确地应用各项技术进行 抽样调查;掌握如何选取样本、样本框, 减少抽样调查的误差,提高抽样调查的 精确度。
(2)联接遗漏单位法,就是指把抽样样本遗漏的 个体和抽样样本中某个值相联接,其联接规则必 须在调查前明确规定。
4.抽样估计的总体参数 (1)总体和 (2)总体中具有某种特定特征的个体总数或它们
在总体中所占的比例或百分率: (3)总体两个不同指标的总和或均值的比值
2020/11/17
11
第二节 概率抽样设计
然后,用简单随机抽样的方法对各类人员 进行抽样。
2020/11/17
26
(三)分层指标的选择
例如,我国国内一般大规模的民意调查都是以居 住地分层的,至少分为城镇和乡村两层。因为城、 乡居民的观念、行为和习惯等是很不相同的。中 央人民广播电台1992年的全国抽样调查是多级分 层的,第一级的分层是按经济发展水平将全国467 个地区分成四层:“经济发达地区”、“经济一 般发达地区”、“不发达地区”和“贫困地区”, 因为根据以往的研究,人们的广播接触行为是与 地区的经济发展水平和个人的经济地位相关的。
用简单随机抽
样或等距抽样
总体个数 较少
总体个数 较多
总体由差 异明显的 几部分组 成
2020/11/17
30
四、整群抽样法
(一)整群抽样法的具体操作 (二)采用整群抽样的原因 (三)整群抽样需注意的几个问题
2020/11/17
31
(一)整群抽样法的具体操作
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2020/11/17
14
2
Sx
nn
(二)简单随机抽样平均误差公式
2
Sx
n
n
是全及总体标准差; n 是抽样单位数
2020/11/17
15
(三)简单随机抽样的方法
1.抽签法 2.随机掷骰子法 3.计算机随机数法 4.随机数表法 5.使用统计软件直接抽取 6.其他方法 7.放回抽样与不放回抽样的比较
同其它调查形式相比,涉及面大、调查的内 容和项目比较简单,但所收集的资料全面准确、 可靠、误差比较小。同时,普查需要占用较多的 人力、花费较多的财力和物力才能完成。
2020/11/17
4
二、全及总体与样本总体
(一)全及总体
概念:
也称目标总体(target population),是由符合研 究目的的所有具有相同性质或特征的个体(individual) 所组成的集合。在抽样调查中,全及总体是抽样推 断的目标。
2020/11/17
7
四、抽样框与抽样框误差
(一)抽样框(sampling frame) 1.抽样框的概念
抽样框就是供抽样调查使用的所有调查单位 的名单。这份名单为调查者提供了辨别和联系调 查总体中个体的有效途径。 2.设计抽样框的要点
准确的抽样框包括两个方面:完整性与不重复 性。①完整性是指不遗漏总体中的任意一个个体; ②不重复性是指任意一个个体不能重复列入抽样 框。
2020/11/17